- Formations
- conversion_path Parcours & Formations
- science Projets
- data_object Exercices de code
- psychology Exercices IA
- quiz Quiz
- Articles
- rss_feed Blog
- sort_by_alpha Glossaire
- menu_book Guides
- help_center FAQ
- media_link Ressources
- Communauté
- groups La communauté
- forum Questions
- live_tv Mentorats
- science Projets mensuels
- Formations
- conversion_path Parcours & Formations
- science Projets
- data_object Exercices de code
- psychology Exercices IA
- quiz Quiz
- Articles
- rss_feed Blog
- sort_by_alpha Glossaire
- menu_book Guides
- help_center FAQ
- media_link Ressources
- Communauté
- groups La communauté
- forum Questions
- live_tv Mentorats
- science Projets mensuels
Inscris-toi
(c'est gratuit !)
Un compte est nécessaire pour participer aux discussions.
Créer un compte person00:00:00 :Dans cette partie, on va voir comment lire un fichier CSV avec la bibliothèque Panda.Donc Panda, c'est la bibliothèque qui va nous permettre de réaliser toutes les opérationsque l'on souhaite sur nos fichiers CSV ou sur d'autres types de fichiers comme des fichiersExcel ou encore des fichiers JSON. Donc avec cette session, vous retrouverez deux fichiers
00:00:19 :sources data.csv et netflixtitles.csv. Donc téléchargez-les et mettez-les dans votredossier. Et si on double clique dessus, vous allez voir donc ce que contiennent ces deux fichiers,
00:00:29 :le fichier data qui contient en fait tout simplement des personnes avec le prix qu'ilsont payé pour une formation. Donc ce sont des données de test, ce ne sont pas des vraies
00:00:37 :personnes ni des vraies adresses email. Et tout ça a été généré aléatoirement avec un site quis'appelle Mokaru. Donc c'est un site très pratique si vous souhaitez générer des données aléatoires
00:00:47 :pour vous entraîner. Donc ça, c'est le premier dataset que l'on va utiliser pour découvrir labibliothèque Panda. Et ensuite, vous avez un fichier CSV qui est netflixtitles.csv qui contient
00:00:59 :lui cette fois-ci des vraies données qui proviennent de Netflix. Donc tous les films, les séries télé,etc. de Netflix avec leur durée, les acteurs, etc. Donc plein de choses importantes qu'on va pouvoir
00:01:09 :utiliser dans cette formation. Donc ce qu'on va faire, c'est déjà créer un Jupyter Notebook.Donc pour ça, sur le launcher ici, vous cliquez sur Python 3 en dessous de Notebook. Sinon,
00:01:19 :vous pouvez cliquer sur le plus. Donc si vous n'avez pas de launcher d'ouvert, vous cliquez surle plus pour ouvrir un launcher. Et vous créez un Notebook en cliquant ici sur Python 3. On va
00:01:28 :renommer notre Notebook en faisant un clic droit et en cliquant sur Rename Notebook. Donc on val'appeler 01 lecture fichier. Je le renomme ici en cliquant sur Rename. Et je vais également changer
00:01:39 :l'interface en allant dans Settings ici. Je vais me mettre en mode sombre pour ne pas vous cramerla rétine. Donc maintenant qu'on a notre Jupyter Notebook qui a été créé, je vais également
00:01:49 :grossir un petit peu l'affichage de mon navigateur pour que vous y voyez quelque chose. Et je vaiscollapser donc cette partie ici en cliquant sur le dossier. Donc on va commencer par importer la
00:01:59 :librairie Panda. Donc on fait Import Pandas et on importe généralement en tant que PD. Alors je leprononce à l'anglaise, vous vous doutez pourquoi. Je vous laisse le prononcer en français et vous
00:02:09 :comprendrez. Donc Import Pandas as PD. Et avec donc PD ici, on va pouvoir utiliser diversesfonctions qui vont nous permettre de lire des fichiers, que ce soit des fichiers CSV ou encoredes fichiers Excel directement. On a plusieurs formats de fichiers qui sont supportés. Donc pour
00:02:26 :exécuter cette cellule, je fais Shift Entrée. Ca va exécuter la cellule. Quand vous voyez lapetite astérisque ici, ça veut dire que l'import est toujours en cours. Donc la cellule est en
00:02:35 :train d'être exécutée. Et une fois qu'on a le numéro ici qui s'affiche, ça veut dire que lacellule a été correctement exécutée. Et ensuite je vais pouvoir écrire d'autres lignes de code dans
00:02:44 :d'autres cellules ici. Vous pouvez également changer pour mettre du Markdown à la place ducode. Donc si je change ici cette cellule pour mettre du Markdown, vous pourrez par exemple
00:02:52 :mettre des annotations. Donc par exemple ici on pourrait mettre lecture d'un fichier CSV. Jevalide là encore avec Shift Entrée et on peut bien entendu déplacer ces cellules en les prenantet en les déplaçant. Donc là voilà j'ai une cellule avec du Markdown et ensuite une cellule
00:03:07 :avec du code. Je vais aller dans cette deuxième cellule ici pour maintenant récupérer les donnéesde mon fichier data.csv. Donc le fichier qui se trouve ici, qui est dans le même dossier que
00:03:16 :mon notebook Jupyter. Donc pour ça on va utiliser pd.read-csv. Donc vous avezplusieurs fonctions comme ça. On a read.csv, on a également read.excel ou encore read.json
00:03:29 :qui vont vous permettre de lire différents types de fichiers. Donc nous on va lire un fichier CSV,on va mettre le chemin vers le fichier, on peut mettre un chemin relatif. Donc dans notre cas on
00:03:37 :va mettre data.csv puisque le fichier CSV se trouve dans le même dossier. Donc ça c'estvraiment parce qu'il est ici que je peux utiliser ce chemin relatif. Sinon vous pouvez mettre le
00:03:46 :chemin complet vers ce fichier CSV. Donc si vous revenez dans les fichiers ici, vous pouvez faireun clic droit et faire copy-paste et ça va vous copier automatiquement le chemin de ce fichier.
00:03:55 :Donc le chemin relatif dans ce cas-ci à partir de mon notebook Jupyter. On va récupérer tout ceque nous retourne cette fonction dans une variable qu'on appelle généralement df. Df pourquoi ? Pour
00:04:06 :data frame. Donc data frame comme ceci c'est en fait le type de l'objet que l'on va récupéreren utilisant cette fonction. Donc je fais shift-entrée pour exécuter cette cellule et ensuite on va
00:04:17 :pouvoir afficher df. Donc je fais tout simplement df, je ne suis pas obligé de faire un print sij'ai juste ça dans ma cellule. Donc on peut faire print et ça marchera de la même façon mais si
00:04:26 :vous avez juste un élément que vous souhaitez afficher vous pouvez juste mettre le nom de lavariable, faire shift-entrée et ça va afficher ce que contient cette variable. Donc ça ne va pas
00:04:34 :tout afficher puisque vous voyez qu'ici on a pas mal de choses. On a 1000 rangées et 10 colonnesdonc c'est en fait ce que contient notre dataset. Si on va voir notre dataset en cliquant sur data
00:04:43 :csv on voit ici qu'on a toutes les colonnes et les 1000 rangées qui constituent notre dataset. Doncen fait ce qu'on a fait ici c'est tout simplement récupérer ce dataset donc ce fichier csv dansune variable que l'on va pouvoir par la suite manipuler avec la bibliothèque panda. Donc voilà
00:04:59 :comment lire un fichier tout simplement avec ces fonctions. Comme je vous dis il y en a plusieursdonc read csv pour les fichiers csv. Les fichiers csv ce sont des fichiers qui sont séparés par des
00:05:08 :virgules. En fait c'est ce que signifie cette extension csv ça signifie comma separated valuesdonc en fait c'est des valeurs séparées par des virgules tout simplement et on pourrait donc trèsbien lire un fichier excel avec la fonction read excel si on avait un fichier excel. Donc voilà
00:05:23 :comment lire des données avec panda et vous avez maintenant votre notebook jupiter qui va conserverces informations donc je peux le fermer je peux faire save ici pour sauvegarder mes changements etsi j'ouvre de nouveau mon fichier en double cliquant dessus vous voyez que l'on retrouve tout ce que
00:05:39 :l'on avait écrit à l'intérieur de notre fichier. Si jamais vous fermez votre jupiter lab donc sion retourne dans notre terminal qu'on arrête jupiter lab et qu'on le relance il faudra réexécuter ceslignes de code pour ça vous pouvez aller dans run ici et cliquer sur run all cells donc ça va en
00:05:54 :fait relancer tout simplement toutes les cellules de votre notebook jupiter. Donc si je fais run allcells vous voyez que là tout est relancé et on a les numéros qui sont mis à jour puisque maintenantce n'est plus la première deuxième et troisième exécution mais la quatrième cinquième et sixième
Ce n'est pas fini...
✋
Tu as complété % du parcours 🔥
Termine l'intégralité de la formation pour pouvoir débloquer ton attestation de réussite.