- Formations
- conversion_path Parcours & Formations
- science Projets
- data_object Exercices de code
- psychology Exercices IA
- quiz Quiz
- Articles
- rss_feed Blog
- sort_by_alpha Glossaire
- menu_book Guides
- help_center FAQ
- media_link Ressources
- Communauté
- groups La communauté
- forum Questions
- live_tv Mentorats
- science Projets mensuels
- Formations
- conversion_path Parcours & Formations
- science Projets
- data_object Exercices de code
- psychology Exercices IA
- quiz Quiz
- Articles
- rss_feed Blog
- sort_by_alpha Glossaire
- menu_book Guides
- help_center FAQ
- media_link Ressources
- Communauté
- groups La communauté
- forum Questions
- live_tv Mentorats
- science Projets mensuels
Inscris-toi
(c'est gratuit !)
Un compte est nécessaire pour participer aux discussions.
Créer un compte person00:00:00 :Dans cette partie on va voir comment ajouter des colonnes à notre DataFrame.On va pouvoir faire énormément de choses, on peut ajouter des colonnes avec desvaleurs par défaut mais ce qui est très intéressant c'est notamment de pouvoirfaire des calculs entre différentes colonnes. Dans notre cas ce qu'on va
00:00:14 :vouloir faire c'est calculer le prix final puisque actuellement si j'affichemon DataFrame on a le prix que le client a payé, on a la taxe et nous ce qu'onaimerait c'est avoir le prix final donc moins la taxe c'est à dire que parexemple pour 3 dollars 73 ici on va enlever 20% et on va ajouter ce prix
00:00:31 :final dans une colonne. Donc on va pouvoir faire comme ça des calculs entredifférentes colonnes à l'intérieur de notre DataFrame. Donc la première choseque je vais faire c'est remplacer les valeurs ici qui sont nulles par desvaleurs de zéro puisque si on a une valeur non renseignée ici on va
00:00:45 :considérer qu'il n'y a pas eu de taxe appliqué. Donc je vais remplacer cesvaleurs grâce à la fonction fillna donc je vais faire df.fillna et on va
00:00:54 :faire ça sur la colonne de taxe donc on va faire hop avec les crochets lacolonne taxe fillna et on va mettre la valeur de zéro et on va indiquerinplace égale true. Donc comme ça ça va modifier directement notre DataFrame et
00:01:06 :si j'affiche mon DataFrame on a bien maintenant une valeur de zéro à laplace des valeurs nulles. On va ensuite devoir modifier notre colonne price paid
00:01:14 :ici puisque actuellement en fait si on affiche le type des données ce qu'onpeut faire avec df.dtypes on va voir dans l'affichage qui nous est retourné
00:01:23 :que la colonne price paid c'est un objet et nous ce qu'on aimerait c'estavoir un nombre donc un float comme avec la taxe ici. Donc pour ça on peut
00:01:32 :utiliser quelque chose qu'on avait vu dans les parties précédentes donc ceslignes ici qui nous permettent de modifier une colonne grâce à laméthode apply. Dans ce cas ci on va modifier la colonne pour remplacer le
00:01:42 :symbole de l'art par une chaîne de caractère vide et ensuite la méthodeas type pour modifier le type de la colonne price paid. Donc je fais tout ça
00:01:49 :et si je raffiche df cette fois ci on voit qu'on a bien maintenant un nombreà l'intérieur de notre colonne et si je refais df.dtypes on va voir que notre
00:01:58 :colonne ici est maintenant de type float 64. Donc on a bien deux nombres dansprice paid et dans taxe et on va pouvoir faire le calcul entre ces deux colonnespour rajouter une colonne. Donc pour rajouter une colonne c'est très simple
00:02:10 :on peut faire tout simplement les crochets comme ceci si par exemple jesouhaitais rajouter une colonne test et mettre un 0 dans toutes les rangées decette colonne donc si je fais ça et que j'affiche le data frame vous voyez qu'ona une nouvelle colonne test avec des valeurs de 0 donc là moi je vais
00:02:25 :supprimer cette colonne donc je vais faire del de df test puisque je n'en aipas besoin donc c'était juste pour vous montrer. Si je raffiche mon data frame on
00:02:32 :voit que cette colonne a bien disparu et donc nous ce qu'on va vouloir faire c'estmultiplier les valeurs qui sont dans cette colonne par la taxe. Alors on va
00:02:40 :devoir faire quelques modifications puisque ici on a un nombre qui est 20 etnous ce qu'on aimerait c'est multiplier le prix ici par non pas 20% mais dans cecas ci ce serait 80% puisque en fait nous ce qu'on veut dans notre colonnec'est le prix qui va rester donc on veut enlever 20% de cette valeur ici. Donc ce
00:02:56 :qu'on va faire c'est déjà dire la colonne dans laquelle on veut mettre toutça donc je vais créer une colonne qui va s'appeler price total et on va direque cette colonne est égale à price paid donc là en fait on va toutsimplement faire des multiplications, des opérations sur différentes colonnes et
00:03:12 :ça va appliquer ces opérations sur chaque rangée de notre data frame. Doncvous voyez c'est vraiment très facile à faire. Dans ce cas ci je vais
00:03:18 :multiplier donc on pourrait faire une multiplication comme ça sur des f detaxe. Si je fais ça pour l'instant vous allez voir que comme je vous disais le
00:03:26 :problème c'est qu'on n'a pas vraiment ce qu'on veut on a juste multiplié l'unpar l'autre donc là on fait 20 fois 9.24 et ça nous donne 184 donc c'est pas
00:03:33 :exactement ça qu'on veut. Je vais supprimer la colonne que je viens decréer donc comme ceci et on va repartir sur notre calcul. Donc là ce qu'il faut
00:03:42 :faire en fait c'est faire un pourcentage donc on va faire df de taxedivisé par 100 et on va faire 1 moins tout ça puisque nous ce qu'on veut c'estpas 20% mais 80 comme je vous disais si on a 20% de taxe ça veut dire que dansnotre poche il reste 80%. Donc on fait 1 moins la taxe divisée par 100 donc là
00:04:01 :par exemple 20 divisé par 100 ça va donner 0,2 et on fait 1 moins 0,2 ça vadonner 0,8 et on va multiplier le prix payé par dans ce cas ci 0,8si on a 20% ici, si on a 0 on va multiplier par 1 moins 0 donc en fait 1
00:04:17 :moins 0 ça va faire 1 et on va récupérer le prix d'origine ok ? Donc là c'estvraiment juste un petit peu de maths, revoyez cette partie si vous n'avez pastout compris et regardez ce calcul bien tranquillement de votre côté si vousn'êtes pas très à l'aise avec les maths. Je vais exécuter cette cellule donc avec
00:04:32 :shift entrée et si j'affiche maintenant le data frame on voit que j'ai bien doncquand on a une taxe de 0 la valeur d'origine et quand j'ai une taxe de 20%on a bien une valeur qui semble logique donc 3,73 80% de ça ça donne 2,984donc vous voyez à quel point on peut très facilement multiplier et faire des
00:04:50 :opérations sur différentes colonnes et rajouter des valeurs dans notre tableaucomme ça par la suite on pourra directement utiliser ces valeurs plutôtqu'à chaque fois avoir besoin de faire des calculs entre différentes colonnes.
00:05:00 :Donc là encore c'est un sujet très complexe de base c'est assez simple vousvoyez on peut juste rajouter une colonne avec des valeurs par défaut ou faire descalculs assez simple mais là encore comme je dis on peut faire des chosesbeaucoup plus avancées. Je vais vous montrer un exemple quelque chose d'assez
00:05:13 :courant imaginez qu'on souhaite créer une nouvelle colonne qui va contenir lecode des pays donc plutôt que Canada on va avoir par exemple CA plutôt queFrance on aurait FR donc là en fait ce qu'on va devoir faire c'est faire unmapping donc c'est à dire que on va indiquer à notre data frame que on veut
00:05:30 :remplacer les valeurs France par la valeur FR et on veut mettre tout ça àl'intérieur d'une nouvelle colonne. Donc pour ça on va pouvoir utiliser la
00:05:37 :méthode map je vais déjà créer un dictionnaire qui va mapper les valeursles unes avec les autres donc je vais créer un dictionnaire countries et dansce dictionnaire on va dire quelles valeurs on veut remplacer par quoi. Donc
00:05:48 :on va dire par exemple United States donc là il faut bien que ce soitexactement comme ce qu'on a dans le tableau donc il faut bien mettre lesmajuscules et tout ça. Donc United States on va le remplacer par UN, la
00:05:58 :France on va le remplacer par FR, le Canada par CA et on a je crois leMaroc voilà le Maroc ici donc le Maroc on va le remplacer par je crois MA çadoit être MA pour le Maroc et donc on a notre dictionnaire on va utiliser cedictionnaire pour faire un mapping et mettre tout ça dans une nouvelle colonne.
00:06:18 :Donc pour faire un mapping on utilise la méthode map donc je vais utiliser ça surma colonne country et on va faire un .map et on va lui passer notre
00:06:27 :dictionnaire et tout ça je vais le mettre dans une nouvelle colonne donc jevais faire df et on va appeler ça country code et on va dire que c'estégal donc à notre colonne country sur laquelle on a fait ce mapping donc pourremplacer les valeurs par d'autres valeurs. J'exécute tout ça, j'affiche mon
00:06:44 :data frame et là on voit qu'on a bien donc une nouvelle colonne country codeet on a bien Canada qui est remplacée par CA, United States par UN et Maroccopar MA et si j'affiche un peu plus de données vous voyez que pour la Franceégalement ça a marché et pour les valeurs qui sont nulles donc les NAN ici
00:07:00 :on a tout simplement la valeur nulle par défaut. Ok donc vous voyez que vraimenton peut faire beaucoup de manipulations comme ça comme je vous dis ça peutdevenir assez complexe rapidement, il faut explorer, il faut aller voir ladoc, il faut regarder plus de tutoriels si vous voulez voir d'autres façons de
00:07:13 :faire et bien sûr chercher sur internet quand vous ne trouvez pas il y a pleinplein plein de ressources qui existent pour vous dire comment faire certainesopérations que vous auriez envie de faire sur vos data frame. Donc c'est
00:07:23 :beaucoup de recherche, beaucoup de documentation, n'hésitez pas à aller voirla documentation si vous allez voir dans help ici vous avez la référence depanda donc panda référence ici, vous pouvez aller voir cette aide elle esten anglais mais elle est quand même très bien faite et elle vous permettra
Ce n'est pas fini...
✋
Tu as complété % du parcours 🔥
Termine l'intégralité de la formation pour pouvoir débloquer ton attestation de réussite.