- Formations
- conversion_path Parcours & Formations
- science Projets
- data_object Exercices de code
- psychology Exercices IA
- quiz Quiz
- Articles
- rss_feed Blog
- sort_by_alpha Glossaire
- menu_book Guides
- help_center FAQ
- media_link Ressources
- Communauté
- groups La communauté
- forum Questions
- live_tv Mentorats
- science Projets mensuels
- Formations
- conversion_path Parcours & Formations
- science Projets
- data_object Exercices de code
- psychology Exercices IA
- quiz Quiz
- Articles
- rss_feed Blog
- sort_by_alpha Glossaire
- menu_book Guides
- help_center FAQ
- media_link Ressources
- Communauté
- groups La communauté
- forum Questions
- live_tv Mentorats
- science Projets mensuels
Inscris-toi
(c'est gratuit !)
Un compte est nécessaire pour participer aux discussions.
Créer un compte person00:00:00 :Pour l'instant dans notre DataFrame on a pas mal de colonnes et toutes ces colonnes ne vont pasforcément nous servir à quelque chose. Par exemple le FirstName, LastName ou encore l'adresse e-mail
00:00:09 :ou l'adresse IP, ce ne sont pas des informations qui vont m'être utiles et donc pour aller un peuplus vite, pour avoir un tableau qui va être un peu plus rapide à analyser, on va pouvoir enleverdes colonnes de notre DataFrame. Pour ça on peut utiliser la méthode drop donc df.drop et on va
00:00:28 :lui spécifier la colonne que l'on souhaite enlever. On pourra en mettre plusieurs bien entendu et onva y revenir plus tard dans la vidéo. Pour l'instant j'ai juste spécifié la colonne IP
00:00:36 :adresse. Il va falloir spécifier un axe puisqu'on peut supprimer des données sur les deux axes doncquand on parle d'axe en fait on va avoir l'axe 0 ou l'axe 1. L'axe 1 ça va être l'axe des colonnes
00:00:48 :donc dans ce sens-ci avec par exemple la colonne e-mail, la colonne gender, IP adresse etc etl'axe 0 ça va être les rangées. Donc par exemple si on souhaitait supprimer certaines rangées à
00:00:57 :l'intérieur de notre DataFrame. Dans ce cas-ci je vais supprimer sur l'axe 1 puisque ce que jeveux supprimer, la colonne IP adresse, c'est une colonne donc on est sur l'axe 1. Donc je valide
00:01:08 :en faisant shift entrée et là vous voyez qu'on a correctement supprimé cette colonne de notretableau. Si je raffiche par la suite mon DataFrame vous voyez que la colonne est toujours présente
00:01:18 :donc rappelez-vous ça c'est tout simplement parce que je n'ai pas spécifié le paramètre in placeégal à true. Donc là deux façons de faire on met in place égal à true ou alors on écrase notre
00:01:28 :variable. Moi je préfère utiliser in place donc je refais cette opération shift entrée une deuxièmefois et si je raffiche df ici vous voyez que cette fois-ci on a bien notre variable qui a étémodifiée. Donc ça c'est sur l'axe 1 comme je vous disais en fait on a supprimé une colonne mais on
00:01:45 :pourrait très bien supprimer également des rangées. Pour que ce soit bien explicite je vais changerl'index et je vais utiliser pour index le genre de chaque personne dans mon DataFrame. Donc on va
00:01:55 :faire df.setindex et on va spécifier la colonne gender et là encore je vais faire ça in placedonc on met in place égal true. Si j'exécute ça et que je raffiche df vous voyez que cette fois-ci
00:02:06 :on a en index le genre de chaque personne dans mon tableau et on va pouvoir si on souhaite supprimercertaines rangées cette fois-ci de notre DataFrame avec une certaine valeur. Donc là par exemple on
00:02:19 :souhaiterait supprimer toutes les rangées qui ont le genre male dans notre tableau. Donc pour ça onpeut refaire drop donc df.drop on va spécifier qu'on souhaite supprimer les rangées qui contiennent
00:02:31 :male ici et cette fois-ci on va utiliser l'axe 0. Donc vous voyez que l'axe a vraiment une importanceet que ça va nous permettre de supprimer soit des colonnes soit des rangées. Dans ce cas-ci on va
00:02:41 :supprimer donc toutes les rangées qui contiennent male ici comme index. On va le faire in place doncje remets in place égal à true, je valide avec shift entrée et si je raffiche le head de mon dfon voit que cette fois-ci on n'a plus que les rangées qui contiennent female ici comme index.
00:02:56 :Donc vous voyez que vraiment cette méthode drop elle permet de faire les opérations dans lesdeux sens en fonction de l'axe donc l'axe 0 pour les rangées et l'axe 1 pour les colonnes. On peut
00:03:07 :bien entendu supprimer plusieurs colonnes d'un coup en spécifiant une liste donc si je refais df.dropet que à l'intérieur des parenthèses je spécifie une liste je pourrais supprimer plusieurs colonnescomme ceci donc en faisant par exemple first name ensuite last name et on va également supprimerpar exemple l'adresse email dont on n'aura pas besoin. Je vais spécifier l'axe là encore donc
00:03:27 :axis égal 1 puisque là on est sur les colonnes et on met in place égal à true, je valide et sij'affiche df de nouveau vous voyez qu'on a pu supprimer plusieurs colonnes d'un coup. On va
00:03:37 :également pouvoir supprimer la colonne id, je vais vous montrer une autre façon de faire encore poursupprimer une colonne et c'est tout simplement avec l'instruction del et on peut spécifier iciune colonne à supprimer en utilisant les crochets donc df crochet id pour spécifier donc la colonneid et l'instruction del va supprimer cette colonne et là dans ce cas-ci on n'a pas besoin de spécifier
00:03:56 :de in place ou quoi que ce soit ça va vraiment supprimer cet objet de notre variable df donc denotre data frame donc si j'exécute ce code on va supprimer cette colonne si je veux le vérifier jerefais un print de df et là vous voyez qu'on a bien la colonne id qui n'est plus présente dans
00:04:11 :notre data frame. Donc voilà différentes façons de faire soit avec drop, drop il faut vraiment bientenir compte de l'axe donc vraiment comprendre ce que l'on fait sur quel axe on modifie les données,bien comprendre donc notre index et nos colonnes vous voyez qu'on peut très bien modifier l'index
Ce n'est pas fini...
✋
Tu as complété % du parcours 🔥
Termine l'intégralité de la formation pour pouvoir débloquer ton attestation de réussite.