im new to SQL in general, so im learning, i had many troubles before, so the code its not clean enough.
here is my trigger, its a update from all the products, generating a table in html,If you can think of another way to do it, I would love to know it to learn, initially I tried to make a cursor inside another cursor but it gave me many errors,some1 recommended to do a trigger before update to go through all the products and only use a cursor to do the checks that I need, thanks for everything <3
(Srry for my english too, hope you can understand me)
BEGIN
declare contentCursor text;
declare tableContent text default "<table width=""250"" cellpadding=""0"" cellspacing=""0""><tbody>";
declare alegenos varchar(30);
declare contieneAlergenos int;
declare trazasCerca int;
declare siCerca text default "";
DECLARE ch_done INT DEFAULT 0;
DECLARE alegenosCursor cursor for select Nombre from ps_ets_ept_alegenos;
DECLARE CONTINUE HANDLER FOR NOT FOUND SET ch_done = 1;
-- Guardo el contenido de la descr (En los primeros 150 productos era una tabla que convertir en otra)
-- SELECT contentCursor;
-- Generar tabla correctamente apartir de la tabla equivocaeda
-- Recorro una tabla con la lista de alergenos
BLOCK2: begin
open alegenosCursor;
bucleAlergenos:LOOP fetch alegenosCursor into alegenos;
IF(ch_done = 1) THEN
-- handle the No data error!
set ch_done=1;
END IF;
-- Veo si el alergeno actual lo tiene la tabla incorrecta
SELECT LOCATE(alegenos, old.content) into contieneAlergenos;
if contieneAlergenos>0 then
-- En el caso de que este busco si tiene un Trazas o un Si, si me coloco al final de la palabra del alergeno, sumandole los 44 Es donde empieza el Si o el Trazas, el siete es por el largo de trazas + 1 espacio
SELECT LOCATE("Trazas",SUBSTR(old.content,contieneAlergenos+length(alegenos)+44,7)) INTO trazasCerca;
-- Si trazasCerca es mayor que 0 el contenido de ese alergeno son Trazas, asi que se lo asigno a la variable siCerca, en caso de que sea 0 le asigno un Si
if trazasCerca>0 then SET siCerca="Trazas";
else SET siCerca="Si";
end if;
-- Concadeno el Si o el Trazas
SELECT CONCAT(tableContent,"<tr><td width=""60%"" align=""left""><strong>", alegenos, "</strong></td><td width=""40%"" align=""left""> ", siCerca, "</td></tr>") INTO tableContent; -- devuelve Alergeno y una string si tiene Trazas o si, hace falta un locate de Si o Trazas y generar la tabla
-- En caso de no encontrar el alergeno, le meto el campo de la tabla con el alergeno y un no
else SELECT CONCAT(tableContent,"<tr><td width=""60%"" align=""left""><strong>", alegenos, "</strong></td><td width=""40%"" align=""left"">No</td></tr>")INTO tableContent ; -- tienes el alergeno que no está en la tabla, aqui generare la td de el alergeno con un No
end if;
-- reinicio las variables que suelo concadenar
SET siCerca="";
SET trazasCerca=0;
SET contieneAlergenos=0;
-- select tableContent as Dentro;
END LOOP bucleAlergenos;
select CONCAT(tableContent,"</tbody></table>")INTO tableContent;
insert into pruebaTablas VALUES (tableContent);
set tableContent="";
close alegenosCursor;
END BLOCK2;
END
I am trying to get the words to appear most often in differents articles. However, I am confronted with the problem of the plural and singular forms of a word.
Table : articles
Id articles
1 <b>Augmentation du nombre de noyades : des pistes d’explications</b><u><br> </u><br/>Paris, le jeudi 12 juin 2019 - Les enquêtes Noyades menées depuis 2002 par Santé publique France ont pour objectifs de recenser l’ensemble des noyades (accidentelles ou non, suivies de décès ou non) et de décrire les caractéristiques des victimes et des circonstances de survenue de ces incidents à des fins de prévention. <br/>Cette enquête est réalisée par questionnaire auprès des services de secours du 1er juin au 30 septembre en France métropolitaine et en Outre-mer. <br/>La dernière enquête a permis de recenser, en 2018, 1 960 noyades dont 30% (597/1 960) ont été suivies de décès. Parmi l’ensemble de ces noyades, 84% (1 649/1 960) étaient d’origine accidentelle, 8% (149/1 960) intentionnelles (tentatives de suicide, suicide ou agression) et 8% (162/1 960) étaient d’origine inconnue. <br/>Les investigateurs se sont plus particulièrement penchés sur les 1 649 noyades accidentelles (dont 25% à l’origine de décès) ces événements ayant augmenté de 30% par rapport à l’enquête de 2015 (1 266) sans qu’on assiste pour autant à une hausse des décès (entre 400 à 500 en moyenne chaque année). <br/><b>La canicule sur le banc des accusés</b><br/>Un premier facteur d’explication de cette forte augmentation des noyades « <i>est le contexte de fortes chaleurs durant la période de l’enquête</i> » soulignent les auteurs de ces travaux publiés dans le Bulletin épidémiologique hebdomadaire. Une étude canadienne a ainsi déjà montré que, sur la période 1999-2009, les températures excédant 30 °C étaient associées à une augmentation de 69% du risque de noyade en extérieur. Or, l’été 2018 a été classé par Météo-France comme le deuxième été le plus chaud depuis 1900. <br/><b>La noyade sèche : un concept faux qui fausse les chiffres</b><br/>Autre facteur explicatif pour les auteurs, la médiatisation depuis quelques années, et particulièrement depuis 2017, du concept de noyade «<i> sèche </i>» (noyade qui interviendrait plusieurs heures, voire plusieurs jours après une activité de baignade) qui ne repose sur aucune réalité scientifique mais qui a pu entraîner une sollicitation plus élevée des services de secours par des parents inquiets à la suite d’un début de noyade d’un enfant. <br/>Autre hypothèse, chez les moins de 6 ans, près des trois-quarts (73%) des noyades accidentelles ont eu lieu en piscine privée familiale. Or, la multiplication de piscines privées hors sol, dépourvues de système de sécurité pourrait être une explication à l’augmentation constatée. <br/><b>Un biais statistique ? </b><br/>Les auteurs soulignent en outre « <i>nous ne pouvons exclure que l’utilisation des données du réseau Oscour</i>® <i>pour la première fois lors de l’enquête 2018 ait pu entraîner une meilleure exhaustivité du recensement des noyades</i> ». Néanmoins, ils tempèrent « <i>Cependant, ceci ne pourrait expliquer qu’une faible partie de l’augmentation du nombre de noyades car lorsque la noyade n’était rapportée que par l’hôpital identifié par les données du réseau Oscour®, elle n’a pas été prise en compte car nous avons considéré que la victime n’avait pas été prise en charge par un service de secours organisé mais avait vraisemblablement été emmenée par un proche</i> ». <br/><b>Xavier Bataille</b></p>
I use this SQL query:
select DISTINCT val, cnt as result from(
select REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE((substring_index(substring_index(t.articles, ' ', n.n), ' ', -1)),',',''),'.',''),'(',''),')',''),'!',''),'?',''),'%',''), '<b>', ' '), '</p>', ' '), '</b>', ' '), '<br/>', ''), '<br>', ''), ',', ' '), '<i>', ' '), '</i>', ' '), '.', ' '), '<u>', ' '), '</u>', ' '), '’', '\''), '*', ' '), '"', ' ') val,count(*) as cnt
from articles t cross join(
select a.n + b.n * 10 + c.n * 100 + 1 as n
from (select 0 as n union all select 1 union all select 2 union all select 3 union all
select 4 union all select 5 union all select 6 union all
select 7 union all select 8 union all select 9
) a cross join
(select 0 as n union all select 1 union all select 2 union all select 3 union all
select 4 union all select 5 union all select 6 union all
select 7 union all select 8 union all select 9
) b cross join
(select 0 as n union all select 1 union all select 2 union all select 3 union all
select 4 union all select 5 union all select 6 union all
select 7 union all select 8 union all select 9
) c
) n
where n.n <= 1 + (length(t.articles) - length(replace(t.articles, ' ', '')))
AND (substring_index(substring_index(t.articles, ' ', n.n), ' ', -1)) NOT REGEXP '^[0-9]+$'
AND (substring_index(substring_index(t.articles, ' ', n.n), ' ', -1)) NOT REGEXP '>[^<]'
AND (substring_index(substring_index(t.articles, ' ', n.n), ' ', -1)) > ''
AND (substring_index(substring_index(t.articles, ' ', n.n), ' ', -1)) NOT REGEXP '[0-9]'
AND CHAR_LENGTH((substring_index(substring_index(t.articles, ' ', n.n), ' ', -1))) > 2
group by val
order by cnt desc
) as x
ORDER BY `result` DESC
SQL DEMO
What I get :
val result
des 15
noyades 10
...
noyade 6
...
What I want :
val result
noyade 16
des 15
...
So my question is: how can I accumulate the plural and singular forms of a word by ignoring the final 's' ?
I would like to replace the words ending with an "s" only if the same word without the final "s" exists
Let's suppose you instead just for the purposes of clarity, extracted all the words into a separate table (it could be a temporary table) called results with a single column named word. I would recommend having an index on column word. Then the following SQL would work:
select word, count(*) from (
select if (word in (
/* all words such as 'noyades' such that 'noyade' also exists */
select distinct sq.word from (
select word, REGEXP_REPLACE(word, '(.*)s', '$1') as edited_word from results
) sq
join results on sq.edited_word = results.word
where sq.word <> edited_word
), REGEXP_REPLACE(word, '(.*)s', '$1'), word) as word from results
) sq
group by word
order by count(*) desc
;
See the following DB-Fiddle
I am trying to get the words to appear most often in different articles while excluding some words that do not interest me.
However, I have a problem with the case sentive, when I exclude the word "ce", I wish that "ce" and "Ce" is excluded but only "ce" is excluded.
Table : articles
Id article
1 <b>Nuit blanche à Lariboisière : les grévistes en arrêt de maladie pour éviter les réquisitions </b><u><br> </u><br/>Paris, le mardi 4 juin 2019 - Les grèves des professionnels de santé ne font généralement pas de bruit. Tout en se déclarant grévistes, les infirmières, médecins, aides-soignants qui souhaitent exprimer leur mécontentement et leurs revendications concernant leurs conditions de travail se contentent généralement de quelques débrayages ponctuels, de grèves administratives et de porter un brassard sur leurs blouses blanches. Cette absence de conséquence directe sur le fonctionnement des services explique que ces mouvements passent souvent inaperçus. Ainsi, même si les colonnes du JIM s’en sont fait régulièrement l’écho ces dernières semaines, les grèves des personnels soignants d’une cinquantaine de services d’urgence français depuis plus d’un mois n’ont guère été relayées. <br/><b>Après une journée de travail, enchaîner la nuit</b><br/>Mais ce matin, la presse nationale ne peut plus ignorer ce phénomène. Hier soir, à l’heure où l’équipe de nuit devait prendre son service aux urgences de l’hôpital Lariboisière, une grande partie des personnels attendus étaient absents. Une vingtaine de personnes selon les syndicats n’ont pas pris leur service. Les réquisitions se sont rapidement révélées impossible : la plupart étaient en effet en arrêt maladie, ce qui empêche le déclenchement de ce type de mesure. Ce sont donc les équipes de jour qui après une première longue période de travail ont dû prendre le relais, multipliant les heures, mettant (peut-être) en péril la sécurité de la prise en charge des patients. <br/><b>Des autorités aux abonnés absents</b><br/>Ce matin, l’information était révélée avec émotion et mettait en lumière d’autres situations périlleuses dans le reste du pays. Ainsi, un interne des urgences de Lons-le-Saunier a raconté au Quotidien du médecin un week-end de l’ascension cauchemardesque, marqué par l’absence de nombreux personnels, médecins comme infirmiers, dont plusieurs en arrêt maladie, alors qu’un mouvement de grève se poursuit dans l’établissement. Bien plus que ses collègues et confrères, le jeune médecin qui est convaincu que les soins délivrés aux patients ont pâti des effectifs réduits et de la fatigue des équipes présentes sur place, blâme les autorités qui n’ont pas su prendre la mesure de la gravité de la situation. L’administration s’est quasiment contenté de s’assurer que les praticiens avaient pu faire face aux urgences, tandis qu’une manifestation sportive potentiellement dangereuse a été maintenue. <br/><b>Que chacun prenne ses responsabilités</b><br/>Pour les syndicats, telle que l’Association des médecins urgentistes de France, si le recours à l’arrêt maladie pour contourner les réquisitions (méthode que l’on avait vu utilisée dans certaines grèves au sein des forces de l’ordre) peut être jugé discutable (il pose notamment la question de la complicité des praticiens prescripteurs de ces arrêts) il témoigne de la souffrance éprouvée par les personnels. « <i>Ce qu’il faut bien comprendre, c’est que la réponse du personnel est liée à l’inconséquence des gens qui nous gouvernent</i> » a ainsi commenté le porte-parole de l’AMUF, le docteur Christophe Prudhomme. Le ministre de la Santé, Agnès Buzyn, interrogée par France Inter a pour sa part estimé que la méthode était un « <i>dévoiement</i> » de « <i>ce qu’est un arrêt maladie. Je pense que ce n’est pas bien car ça entraîne une surcharge de travail pour les autres</i> » a-t-elle observé. Alors que ce jugement sera sans doute critiqué, le ministre a encore tenu à rappeler que les discussions avec les urgentistes avaient été nombreuses et que des sommes importantes avaient déjà été débloquées. Elle a en outre considéré que la crise des urgences était principalement liée à la difficulté pour les Français de pouvoir consulter un médecin en ville (ce qui sera probablement commenté par les représentants des médecins libéraux). Elle a d’ailleurs enjoint les Français à différer le plus possible leurs visites aux urgences. <br/>Mais si la question de la responsabilité des citoyens ne pourra pas être toujours éludée, celle de la fermeture de lits, de la réorganisation de certaines structures et de la vacance de nombreux postes ne le pourra pas plus. <br/><b>Aurélie Haroche </b></p>
Table containing the words to exclude :
Table : exception
Id keyword
1 ce
I use this SQL query:
select DISTINCT val, cnt as result from(
select REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE((substring_index(substring_index(t.article, ' ', n.n), ' ', -1)),',',''),'.',''),'(',''),')',''),'!',''),'?',''),'%',''), '<b>', ' '), '</p>', ' '), '</b>', ' '), '<br/>', ''), '<br>', ''), ',', ' '), '<i>', ' '), '</i>', ' '), '.', ' '), '<u>', ' '), '</u>', ' ') val,count(*) as cnt
from articles t cross join(
select a.n + b.n * 10 + c.n * 100 + 1 as n
from (select 0 as n union all select 1 union all select 2 union all select 3 union all
select 4 union all select 5 union all select 6 union all
select 7 union all select 8 union all select 9
) a cross join
(select 0 as n union all select 1 union all select 2 union all select 3 union all
select 4 union all select 5 union all select 6 union all
select 7 union all select 8 union all select 9
) b cross join
(select 0 as n union all select 1 union all select 2 union all select 3 union all
select 4 union all select 5 union all select 6 union all
select 7 union all select 8 union all select 9
) c
) n
where n.n <= 1 + (length(t.article) - length(replace(t.article, ' ', '')))
AND (substring_index(substring_index(t.article, ' ', n.n), ' ', -1)) NOT REGEXP '^[0-9]+$'
AND (substring_index(substring_index(t.article, ' ', n.n), ' ', -1)) > ''
AND REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE((substring_index(substring_index(t.article, ' ', n.n), ' ', -1)),',',''),'.',''),'(',''),')',''),'!',''),'?',''),'%',''), '<b>', ' '), '</p>', ' '), '</b>', ' '), '<br/>', ''), '<br>', ''), ',', ' '), '<i>', ' '), '</i>', ' '), '.', ' '), '<u>', ' '), '</u>', ' ') NOT IN (SELECT keyword FROM exception)
group by val
order by cnt desc
) as x
ORDER BY `result` DESC
I get list of all the words with their numbers of appearance . The word "ce" is excluded but "Ce" is not excluded.
What I tried:
LOWER(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE((substring_index(substring_index(t.article, ' ', n.n), ' ', -1)),',',''),'.',''),'(',''),')',''),'!',''),'?',''),'%',''), '<b>', ' '), '</p>', ' '), '</b>', ' '), '<br/>', ''), '<br>', ''), ',', ' '), '<i>', ' '), '</i>', ' '), '.', ' '), '<u>', ' '), '</u>', ' ')) NOT IN (SELECT keyword FROM exception)
But that does not work..
My question is therefore, how to exclude a word with the first letter in upper case by inserting in the table of exclusion the word in lower case ?
EDIT
I think, I have found the problem :
With
select (substring_index(substring_index(t.articles, ' ', n.n), ' ', -1)) val,count(*) as cnt
I get :
val result
<i>Ce 2
How can I delete special characters pasted to words?
How about you first convert everything to lower case and then use the REPLACE() function?
This would convert everything to lower case and then you could do the replace
EDIT
Try regex SELECT * from table WHERE colmn_name REGEXP '>[^<]*mytext';
I've a mysql table with a lot of folderNames and Directory names, for Example "C:\xx\xyz" or "C:\xx" or "C:\xx\xyz\abc".
Now I have to sort this Query by the count of this Backslashes. I need the Dir C:\xx as first, because I have to create this Directory before I can create a sub-dir in it.
How can I do this?
Something like this:
SELECT dirName
FROM yourTable
ORDER BY (LENGTH(dirName) - LENGTH(REPLACE(dirName, '\\', '')))
SQLFillde demo
ORDER BY LENGTH(folder)-LENGTH(REPLACE(folder,'\\',''))
It's often not necessary to create directories in order:
C:\>mkdir test
C:\>dir test
El volumen de la unidad C es Sistema
El número de serie del volumen es: 6882-2759
Directorio de C:\test
15/02/2013 12:01 <DIR> .
15/02/2013 12:01 <DIR> ..
0 archivos 0 bytes
2 dirs 115.358.355.456 bytes libres
C:\>mkdir test\foo\bar\one\two\three
C:\>dir test
El volumen de la unidad C es Sistema
El número de serie del volumen es: 6882-2759
Directorio de C:\test
15/02/2013 12:02 <DIR> .
15/02/2013 12:02 <DIR> ..
15/02/2013 12:02 <DIR> foo
0 archivos 0 bytes
3 dirs 115.358.355.456 bytes libres
C:\>