Les bases de la data science avec pandas

Découvre les bases de la science des données avec la bibliothèque pandas.
Commencer le la formation play_circle
  • grade grade grade
    Débutant
  • schedule 1 heures 33 minutes
  • list 26 sessions
Introduction à la formation

1. Introduction à la formation

schedule

01:51

Lors de cette première rencontre, vous allez découvrir le monde fascinant de la data science à travers la bibliothèque pandas. Nous allons nous plonger dans les notions fondamentales de cette discipline en s'appuyant sur l'outil pandas, véritable référence dans le domaine. Vous allez bientôt maîtriser les bases de la manipulation de données, un savoir-faire indispensable pour tout data scientist en devenir.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Les fichiers sources

2. Les fichiers sources

schedule

00:29

Durant cette session, vous allez découvrir tous les fichiers sources essentiels de notre formation dédiée aux bases de la data science avec pandas. En approfondissant le contenu partagé sur le dépôt Github, vous serez en mesure de mieux comprendre et de suivre chaque partie de notre programme d'apprentissage.

  • closed_caption Sous-titres cancel
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Qu'est-ce que la science des données ?

3. Qu'est-ce que la science des données ?

schedule

06:02

Vous allez découvrir dans cette session le monde fascinant de la science des données. Vous comprendrez son importance dans le décodage des informations complexes et son application dans notre quotidien. Des concepts clés seront introduits pour vous donner une solide compréhension de ce qu'est la science des données et pourquoi elle est cruciale dans notre ère numérique actuelle. Nous allons également aborder les perspectives de carrière qu'elle offre.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Configuration de Jupyter Lab sur Windows

4. Configuration de Jupyter Lab sur Windows

schedule

03:55

Vous allez débuter votre voyage dans la science de données en installant et configurant Jupyter Lab sur Windows. Nous allons vous guider pas à pas pour effectuer une installation réussie et sans complications techniques. Vous allez apprendre à préparer un environnement de travail efficace et approprié pour manipuler la bibliothèque pandas.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Configuration de Jupyter Lab sur Linux

5. Configuration de Jupyter Lab sur Linux

schedule

00:33

Dans cette session, vous allez découvrir comment installer et configurer Jupyter Lab sur un système Linux. Cette étape est essentielle pour maîtriser l'outil de base de la data science, Pandas. Nous allons aborder l'installation via pip et le terminal, capacité qui se révèlera précieuse pour d'autres environnements de développement. C'est un prérequis crucial pour les prochaines sessions.

  • closed_caption Sous-titres cancel
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Configuration de Jupyter Lab sur Mac OS

6. Configuration de Jupyter Lab sur Mac OS

schedule

03:36

Lors de cette session, vous allez installer et configurer Jupyter Lab, un environnement de travail utilisé en Data Science, sur votre système d'exploitation Mac OS. Vous vous familiariserez avec son interface et les fonctionnalités clés pour commencer à travailler avec la bibliothèque Pandas. Nous aborderons également la gestion des erreurs courantes lors de l'installation.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Lire un fichier CSV avec pandas

7. Lire un fichier CSV avec pandas

schedule

06:14

Au cours de cette session, vous allez plonger dans les fonctionnalités de base de la bibliothèque pandas. De manière précise, vous allez apprendre comment lire un fichier CSV de manière efficace avec pandas. Nous allons ensemble explorer l'importance des données CSV en science des données et comment les manipuler avec pandas. Vous serez bientôt capable de charger, lire et comprendre les jeux de données en format CSV.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Analyser le dataframe

8. Analyser le dataframe

schedule

07:21

Dans cette session, vous allez découvrir comment analyser effectivement un dataframe avec pandas. Vous allez explorer les différentes méthodes pour examiner, trier et filtrer les données. De plus, nous allons voir comment manipuler la structure d'un dataframe pour aider à extraire des informations utiles. Cette étape cruciale vous aidera à préparer vos données pour une analyse plus approfondie et à obtenir des résultats précis.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Sélectionner des données

9. Sélectionner des données

schedule

09:24

Dans cette session, vous allez maîtriser comment sélectionner des données spécifiques à l'aide de la bibliothèque pandas. Nous allons explorer les différentes techniques pour filtrer et affiner vos jeux de données. Préparez-vous à plonger dans le monde fascinant de la manipulation des données, la pièce maîtresse de la science des données.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Les filtres

10. Les filtres

schedule

08:48

Dans cette session, vous allez découvrir comment utiliser efficacement les filtres dans pandas pour manipuler et analyser des ensembles de données. Nous allons apprendre à extraire des informations précises, à filtrer des données spécifiques et à comprendre l'importance des filtres en data science.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Supprimer une colonne

11. Supprimer une colonne

schedule

04:52

Dans cette session, vous allez découvrir comment supprimer une colonne dans votre dataframe en utilisant la bibliothèque pandas. Nous allons aborder les différents moyens d'éliminer les colonnes inutiles pour simplifier l'analyse de vos données. Vous apprendrez aussi à maîtriser les erreurs Classiques lors de ce processus.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Traiter les valeurs manquantes

12. Traiter les valeurs manquantes

schedule

07:19

Dans cette session, vous vous familiariserez avec les techniques de gestion des valeurs manquantes. Vous allez apprendre comment identifier les données manquantes dans votre série ou DataFrame pandas, comment les gérer adéquatement en les éliminant ou en les remplaçant, pour obtenir des analyses de données fiables. Nous allons également explorer les stratégies différentes à utiliser selon le contexte.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Ajouter des colonnes

13. Ajouter des colonnes

schedule

07:39

Dans cette session, vous allez découvrir comment ajouter des colonnes à vos bases de données en utilisant la bibliothèque pandas. Nous allons parcourir ensemble les différentes méthodes et techniques pour manipuler efficacement vos données. Ce sera un atout clé pour approfondir vos compétences en science des données.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Analyser les données

14. Analyser les données

schedule

11:27

Dans cette session, vous allez vous familiariser avec l'analyse de données en utilisant la bibliothèque pandas, un outil crucial en data science. Vous allez comprendre comment examiner, nettoyer et transformer vos données pour faciliter leur analyse. Nous allons explorer ensemble les méthodes de manipulation et de visualisation offertes par pandas.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Installation de matplotlib

15. Installation de matplotlib

schedule

01:14

Au fil de cette session, vous allez installer et explorer les fonctionnalités de Matplotlib. Vous découvrirez comment ce module s'intègre dans la bibliothèque pandas et son importance cruciale pour la visualisation de données en science des données. Nous allons aussi aborder ses aspects pratiques qui facilitent le traitement des données complexes.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Tracer une courbe avec matplotlib

16. Tracer une courbe avec matplotlib

schedule

02:41

Dans cette session, vous allez maîtriser l'art de tracer des courbes en utilisant matplotlib, un outil essentiel pour la visualisation de données en data science. Nous explorerons ensemble les différentes fonctionnalités offertes par cet outil pour optimiser la représentation graphique de vos données issues de pandas. Cette compétence vous permettra d'analyser davantage vos données et d'en tirer des conclusions pertinentes.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
D'autres types de graphiques

17. D'autres types de graphiques

schedule

03:16

Découvrez de nouveaux types de visualisations graphiques dans le domaine de la science des données en utilisant la bibliothèque pandas. Avec nous, vous allez apprendre à générer des graphiques plus complexes qui mettent en valeur vos analyses et aident à mieux comprendre vos données. Cette session vous offre un nouveau niveau d'expertise en visualisation de données avec pandas.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Présentation du jeu de données Netflix

18. Présentation du jeu de données Netflix

schedule

01:21

Lors de cette session, vous allez explorer un jeu de données issu de Netflix en utilisant la bibliothèque pandas. Vous allez apprendre à importer les données, à les nettoyer et à les interpréter pour tirer les premières conclusions. Cette session vous aidera à poser les bases de votre expertise en science des données avec Python et pandas.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Récupérer les trois pays les plus importants - Introduction

19. Récupérer les trois pays les plus importants - Introduction

schedule

01:23

Dans cette session, vous allez découvrir comment utiliser pandas, une bibliothèque centrale en data science, pour extraire et manipuler les informations précises d'un dataset. Plus concrètement, nous allons vous montrer comment récupérer les trois pays les plus importants à partir de vos données. Vous allez développer une compréhension pratique de l'utilisation des fonctions pandas pour filtrer, trier et obtenir des statistiques.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Réservé aux membres Premium
Récupérer les trois pays les plus importants - Solution

20. Récupérer les trois pays les plus importants - Solution

schedule

03:21

  • closed_caption Sous-titres cancel
  • format_quote Résumé textuel cancel
Réservé aux membres Premium
Récupérer le nombre de films par années - Introduction

21. Récupérer le nombre de films par années - Introduction

schedule

00:47

Au cours de cette session, vous allez découvrir comment manipuler et analyser des données de film pour obtenir des statistiques précises par année. À l'aide de la bibliothèque pandas, nous allons apprendre à agréger les informations afin d'extraire le nombre de films produits chaque année.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Réservé aux membres Premium
Récupérer le nombre de films par années - Solution

22. Récupérer le nombre de films par années - Solution

schedule

02:09

  • closed_caption Sous-titres cancel
  • format_quote Résumé textuel cancel
Réservé aux membres Premium
Récupérer la liste de tous les réalisateurs - Introduction

23. Récupérer la liste de tous les réalisateurs - Introduction

schedule

01:03

Lors de cette session, vous allez découvrir comment extraire une liste de tous les réalisateurs en utilisant justement pandas, bibliothèque Python dédiée à la manipulation de données. Nous nous pencherons sur l'importation de données, leur traitement et leur extraction spécifique pour répondre à des besoins précis en Data Science.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Réservé aux membres Premium
Récupérer la liste de tous les réalisateurs - Solution

24. Récupérer la liste de tous les réalisateurs - Solution

schedule

03:16

  • closed_caption Sous-titres cancel
  • format_quote Résumé textuel cancel
Réservé aux membres Premium
Récupérer la durée moyenne des films - Introduction

25. Récupérer la durée moyenne des films - Introduction

schedule

03:22

Dans cette session, vous allez explorer comment use de la bibliothèque pandas pour extraire des informations précises d'un ensemble de données. Plus précisément, nous nous concentrerons sur le calcul de la durée moyenne des films à l'aide de diverses techniques de manipulation de data frames. À la fin, vous serez en mesure de tirer efficacement des informations statistiques d'une base de données.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Réservé aux membres Premium
Récupérer la durée moyenne des films - Solution

26. Récupérer la durée moyenne des films - Solution

schedule

05:44

  • closed_caption Sous-titres cancel
  • format_quote Résumé textuel cancel
Réservé aux membres Premium

Rechercher sur le site

open_in_new

Formulaire de contact

Inscris-toi à Docstring

Pour commencer ton apprentissage.

Tu as déjà un compte ? Connecte-toi.