- Formations
- conversion_path Parcours & Formations
- science Projets
- data_object Exercices de code
- psychology Exercices IA
- quiz Quiz
- Articles
- rss_feed Blog
- sort_by_alpha Glossaire
- menu_book Guides
- help_center FAQ
- media_link Ressources
- Communauté
- groups La communauté
- forum Questions
- live_tv Mentorats
- science Projets mensuels
- Formations
- conversion_path Parcours & Formations
- science Projets
- data_object Exercices de code
- psychology Exercices IA
- quiz Quiz
- Articles
- rss_feed Blog
- sort_by_alpha Glossaire
- menu_book Guides
- help_center FAQ
- media_link Ressources
- Communauté
- groups La communauté
- forum Questions
- live_tv Mentorats
- science Projets mensuels
Inscris-toi
(c'est gratuit !)
Un compte est nécessaire pour participer aux discussions.
Créer un compte person00:00:00 :Vous vous êtes déjà sûrement inscrit sur un site web où l'on vous demandait d'entrer votre adresse mail et votre numéro de téléphone.Vous avez sûrement aussi déjà remarqué que si vous entrez une adresse mail ou un numéro incorrect,le site vous retourne alors une erreur et vous demande de la corriger.
00:00:15 :Tout ceci est rendu possible grâce à ce qu'on appelle les expressions régulières.Les expressions régulières, qu'on appelle aussi regex, qui vient de la contraction des mots anglais regular et expression,c'est un moyen très puissant de vérifier si une chaîne de caractère est de la forme désirée.
00:00:31 :Dans cette partie, on va s'attaquer aux regex en Python.Je vais vous expliquer comment déterminer si une chaîne de caractère correspond à ce que vous vous attendez à avoir.
00:00:40 :Pour vous donner un petit aperçu de ce à quoi peut ressembler une expression régulière,vous voyez ici l'expression régulière qui permet de déterminer si un numéro de téléphone français est valide.
00:00:50 :On va vérifier avec cette expression régulière si on a bien 5 séquences de 2 nombres ici,qui sont séparées par des tirets, et si le numéro commence bien par un 0.
00:00:59 :Vous voyez que ça fait un peu peur au début, on n'y comprend vraiment rien, il y a plein de symboles dans tous les sens.Le regex, les expressions régulières, c'est vraiment un espèce de langage codé.
00:01:08 :Mais vous allez voir qu'une fois qu'on comprend comment aller chercher l'information,ça peut même devenir assez intéressant et marrant d'essayer de trouver les patterns à l'intérieur des chaînes de caractère.
00:01:21 :On va voir tout de suite comment utiliser ces expressions régulières,comment utiliser ce langage d'expression régulière pour aller chercher l'information qu'on veut.Il y a deux choses qu'on va avoir besoin de faire quand on va créer notre expression régulière.
00:01:34 :La première, c'est de savoir ce qu'on veut chercher,et la deuxième, avec ces symboles ici, c'est combien de fois on va le chercher.Est-ce qu'on va le chercher 0 ou 1 fois, 0 à l'infini, 3 fois à l'infini, entre 0 et 3 fois, etc.
00:01:48 :On va commencer par chercher le caractère qu'on veut.On a un petit tableau ici, un petit récapitulatif de comment aller chercher les caractères qu'on veut.
00:01:57 :On va commencer ici avec le point, le point qui correspond à tous les caractères possibles.C'est vraiment tout ce que vous pouvez avoir sur votre clavier,que ce soit des nombres, des lettres, mais aussi des symboles,comme par exemple l'arobase, un dièse, un symbole dollar, un symbole de division,
00:02:13 :tous ces trucs-là, ça va être récupéré par le point.On a ici une possibilité de récupérer une liste de caractères,ça peut être des caractères individuels, donc on va les mettre entre crochets ici.
00:02:24 :Si on veut récupérer une fourchette de caractères,par exemple les caractères entre A et F majuscule, comme ici, on va mettre un tiret.Si j'avais voulu récupérer uniquement les lettres A et F, je n'aurais pas mis le tiret ici,j'aurais juste sélectionné ici comme ça la lettre A et la lettre F majuscule.
00:02:40 :Avec le tiret ici, ça nous permet de définir une fourchette d'élémentsqui sont compris entre l'élément A et l'élément F, par exemple, dans ce cas-ci.
00:02:50 :On a ici une syntaxe pour aller chercher l'un ou l'autre.Si on va chercher dans une chaîne de caractères, est-ce qu'on a soit Python, soit C++,on n'est pas sûr si c'est l'un ou l'autre, mais on veut savoir lequel on va avoir,on peut chercher soit pour Python, soit pour C++ avec cette syntaxe ici.
00:03:05 :Cette fois-ci, des parenthèses et une barre comme ceci pour séparer les éléments qu'on veut chercher.Ici, on va avoir l'accent circonflexe qui nous permet de chercher le contraire de ce qu'on veut,donc l'inverse si vous voulez.
00:03:17 :Si on met par exemple un accent circonflexe et la lettre A, par exemple,après l'accent circonflexe, on va chercher tout sauf la lettre A.Le slash D ici, D minuscule, ça nous permet de chercher uniquement des chiffres.
00:03:31 :Là, vous voyez que j'ai mis que c'était équivalent à 0-9 entre crochets,donc vous allez voir que souvent il y a plusieurs façons, comme dans tout en Python et en programmation générale,c'est pareil pour les expressions régulières, il y a plusieurs façons d'aller chercher la même information.
00:03:45 :Donc le slash D ici qui nous permet de récupérer uniquement des chiffres,ou le crochet ici 0-9 pour aller chercher tous les chiffres compris entre 0 et 9.
00:03:54 :Donc ça, ça permet d'avoir un petit peu plus de précision puisque le slash D va nous récupérer tous les nombres,alors que le 0-9, on pourrait par exemple dire 1-9 si on voulait exclure le 0,donc ça nous donne un petit peu plus de latitude avec cette façon de faire ici.
00:04:08 :Si vous savez directement que vous voulez récupérer tous les chiffres, vous pouvez y aller directement avec slash D.L'inverse ici, donc slash D majuscule qui nous récupère tout sauf des chiffres,donc là encore vous voyez que l'équivalent c'est de faire entre crochets 0-9,mais cette fois-ci précédé d'un accent circonflexe,
00:04:25 :donc puisqu'on a vu ici plus haut que l'accent circonflexe permettait d'aller chercher le contraire de ce qu'on veut,donc là le contraire de 0-9, donc tout sauf des chiffres comme indiqué ici.
00:04:35 :On a le slash S ici qui nous permet de récupérer un espace,le slash W un caractère alphanumérique, donc là équivalent à A-Z minuscule, A-Z majuscule et 0-9.
00:04:48 :W majuscule qui cette fois nous permet de récupérer tout sauf un caractère alphanumérique,donc là encore l'équivalent de ce qu'on a au-dessus,sauf que cette fois-ci on a un accent circonflexe pour indiquer qu'on veut l'inverse de ce qu'on va spécifier ici.
00:05:01 :Et pour finir, non pas le moindre, le slash tout seul qui nous permet comme en Python d'échapper à un caractère.Donc là c'est par exemple si on va chercher dans une chaîne de caractères un point,vu que le point est déjà utilisé, c'est déjà un symbole en fait utilisé dans notre expression régulière
00:05:16 :pour aller chercher tous les caractères possibles,et bien si on veut lui dire qu'on veut récupérer un point,il va falloir indiquer donc avec le slash ici que ce n'est pas le point de l'expression régulière,donc le point qui correspond à tous les caractères, mais vraiment le caractère point qu'on veut chercher.
00:05:31 :Donc ça là encore une fois comme en Python, le slash qui permet d'échapper à un caractère spécial.On va voir tout de suite maintenant comment compter le nombre de fois qu'on va retrouver l'élément,donc l'élément qu'on aura sélectionné auparavant avec ces symboles ici,combien de fois on va le récupérer dans notre chaîne de caractères.
00:05:49 :Donc ça, ça va être disponible avec ces différentes nomenclatures ici.Donc on va avoir déjà le point d'interrogation qui va récupérer 0 ou 1 fois,l'étoile 0 à l'infini, donc ça peut être 0 fois,donc le caractère qu'on va chercher peut apparaître 0 fois ou autant de fois qu'on veut,
00:06:08 :plus qui va être de 1 à l'infini.On peut chercher exactement 3, donc là ça va être des accolades,et pour en chercher exactement 3 on va mettre juste 3.
00:06:17 :Si on cherche de 3 à l'infini, donc là on va mettre 3 virgule,de 0 à 3 fois virgule 3, de 3 fois à l'infini,alors là je l'ai répété en fait, je ne m'étais même pas rendu compte,alors je vais supprimer cette ligne,donc de 3 à l'infini voilà, de 0 à 3 fois et de 3 à 6 fois,
00:06:34 :donc 3,6, pour récupérer entre 3 et 6 fois le caractère qu'on va chercher.Donc je passe assez vite là-dessus, puisque vous voyez que,en fait ça moi souvent je ne les retiens même pas tous par cœur,il y en a souvent que j'oublie, ça c'est le genre de truc que vous allez chercher,
00:06:49 :vous allez vous imprimer une feuille si vous avez à en faire souvent,et vous allez vous référer à cette feuille ou ce site internet,j'en ai quelques-uns que je vous montrerai plus tard,des sites internet qui répertorient tous ces symboles en fait,puisque c'est des fois un peu dur de les retenir,
00:07:05 :donc ne vous inquiétez pas si ça fait beaucoup d'informations pour l'instant,vous n'êtes pas obligé de les retenir,l'important c'est vraiment de comprendre comment ça fonctionne,et donc on va voir tout de suite dans la prochaine partie,comment on va récupérer, donc un exemple concret,qui va vous montrer comment récupérer l'information qu'on veut.
Ce n'est pas fini...
✋
Tu as complété % du parcours 🔥
Termine l'intégralité de la formation pour pouvoir débloquer ton attestation de réussite.