Les bases de la data science avec pandas

Découvre les bases de la science des données avec la bibliothèque pandas.
Commencer le la formation
  • grade grade grade
    Débutant
  • schedule 1 heures 33 minutes
  • list 26 sessions
Introduction à la formation

1. Introduction à la formation

01:51

Lors de cette première rencontre, vous allez découvrir le monde fascinant de la data science à travers la bibliothèque pandas. Nous allons nous plonger dans les notions fondamentales de cette discipline en s'appuyant sur l'outil pandas, véritable référence dans le domaine. Vous allez bientôt maîtriser les bases de la manipulation de données, un savoir-faire indispensable pour tout data scientist en devenir.

  • Sous-titres
  • Résumé textuel
Voir la session
Les fichiers sources

2. Les fichiers sources

00:29

Durant cette session, vous allez découvrir tous les fichiers sources essentiels de notre formation dédiée aux bases de la data science avec pandas. En approfondissant le contenu partagé sur le dépôt Github, vous serez en mesure de mieux comprendre et de suivre chaque partie de notre programme d'apprentissage.

  • Sous-titres
  • Résumé textuel
Voir la session
Qu'est-ce que la science des données ?

3. Qu'est-ce que la science des données ?

06:02

Vous allez découvrir dans cette session le monde fascinant de la science des données. Vous comprendrez son importance dans le décodage des informations complexes et son application dans notre quotidien. Des concepts clés seront introduits pour vous donner une solide compréhension de ce qu'est la science des données et pourquoi elle est cruciale dans notre ère numérique actuelle. Nous allons également aborder les perspectives de carrière qu'elle offre.

  • Sous-titres
  • Résumé textuel
Voir la session
Configuration de Jupyter Lab sur Windows

4. Configuration de Jupyter Lab sur Windows

03:55

Vous allez débuter votre voyage dans la science de données en installant et configurant Jupyter Lab sur Windows. Nous allons vous guider pas à pas pour effectuer une installation réussie et sans complications techniques. Vous allez apprendre à préparer un environnement de travail efficace et approprié pour manipuler la bibliothèque pandas.

  • Sous-titres
  • Résumé textuel
Voir la session
Configuration de Jupyter Lab sur Linux

5. Configuration de Jupyter Lab sur Linux

00:33

Dans cette session, vous allez découvrir comment installer et configurer Jupyter Lab sur un système Linux. Cette étape est essentielle pour maîtriser l'outil de base de la data science, Pandas. Nous allons aborder l'installation via pip et le terminal, capacité qui se révèlera précieuse pour d'autres environnements de développement. C'est un prérequis crucial pour les prochaines sessions.

  • Sous-titres
  • Résumé textuel
Voir la session
Configuration de Jupyter Lab sur Mac OS

6. Configuration de Jupyter Lab sur Mac OS

03:36

Lors de cette session, vous allez installer et configurer Jupyter Lab, un environnement de travail utilisé en Data Science, sur votre système d'exploitation Mac OS. Vous vous familiariserez avec son interface et les fonctionnalités clés pour commencer à travailler avec la bibliothèque Pandas. Nous aborderons également la gestion des erreurs courantes lors de l'installation.

  • Sous-titres
  • Résumé textuel
Voir la session
Lire un fichier CSV avec pandas

7. Lire un fichier CSV avec pandas

06:14

Au cours de cette session, vous allez plonger dans les fonctionnalités de base de la bibliothèque pandas. De manière précise, vous allez apprendre comment lire un fichier CSV de manière efficace avec pandas. Nous allons ensemble explorer l'importance des données CSV en science des données et comment les manipuler avec pandas. Vous serez bientôt capable de charger, lire et comprendre les jeux de données en format CSV.

  • Sous-titres
  • Résumé textuel
Voir la session
Analyser le dataframe

8. Analyser le dataframe

07:21

Dans cette session, vous allez découvrir comment analyser effectivement un dataframe avec pandas. Vous allez explorer les différentes méthodes pour examiner, trier et filtrer les données. De plus, nous allons voir comment manipuler la structure d'un dataframe pour aider à extraire des informations utiles. Cette étape cruciale vous aidera à préparer vos données pour une analyse plus approfondie et à obtenir des résultats précis.

  • Sous-titres
  • Résumé textuel
Voir la session
Sélectionner des données

9. Sélectionner des données

09:24

Dans cette session, vous allez maîtriser comment sélectionner des données spécifiques à l'aide de la bibliothèque pandas. Nous allons explorer les différentes techniques pour filtrer et affiner vos jeux de données. Préparez-vous à plonger dans le monde fascinant de la manipulation des données, la pièce maîtresse de la science des données.

  • Sous-titres
  • Résumé textuel
Voir la session
Les filtres

10. Les filtres

08:48

Dans cette session, vous allez découvrir comment utiliser efficacement les filtres dans pandas pour manipuler et analyser des ensembles de données. Nous allons apprendre à extraire des informations précises, à filtrer des données spécifiques et à comprendre l'importance des filtres en data science.

  • Sous-titres
  • Résumé textuel
Voir la session
Supprimer une colonne

11. Supprimer une colonne

04:52

Dans cette session, vous allez découvrir comment supprimer une colonne dans votre dataframe en utilisant la bibliothèque pandas. Nous allons aborder les différents moyens d'éliminer les colonnes inutiles pour simplifier l'analyse de vos données. Vous apprendrez aussi à maîtriser les erreurs Classiques lors de ce processus.

  • Sous-titres
  • Résumé textuel
Voir la session
Traiter les valeurs manquantes

12. Traiter les valeurs manquantes

07:19

Dans cette session, vous vous familiariserez avec les techniques de gestion des valeurs manquantes. Vous allez apprendre comment identifier les données manquantes dans votre série ou DataFrame pandas, comment les gérer adéquatement en les éliminant ou en les remplaçant, pour obtenir des analyses de données fiables. Nous allons également explorer les stratégies différentes à utiliser selon le contexte.

  • Sous-titres
  • Résumé textuel
Voir la session
Ajouter des colonnes

13. Ajouter des colonnes

07:39

Dans cette session, vous allez découvrir comment ajouter des colonnes à vos bases de données en utilisant la bibliothèque pandas. Nous allons parcourir ensemble les différentes méthodes et techniques pour manipuler efficacement vos données. Ce sera un atout clé pour approfondir vos compétences en science des données.

  • Sous-titres
  • Résumé textuel
Voir la session
Analyser les données

14. Analyser les données

11:27

Dans cette session, vous allez vous familiariser avec l'analyse de données en utilisant la bibliothèque pandas, un outil crucial en data science. Vous allez comprendre comment examiner, nettoyer et transformer vos données pour faciliter leur analyse. Nous allons explorer ensemble les méthodes de manipulation et de visualisation offertes par pandas.

  • Sous-titres
  • Résumé textuel
Voir la session
Installation de matplotlib

15. Installation de matplotlib

01:14

Au fil de cette session, vous allez installer et explorer les fonctionnalités de Matplotlib. Vous découvrirez comment ce module s'intègre dans la bibliothèque pandas et son importance cruciale pour la visualisation de données en science des données. Nous allons aussi aborder ses aspects pratiques qui facilitent le traitement des données complexes.

  • Sous-titres
  • Résumé textuel
Voir la session
Tracer une courbe avec matplotlib

16. Tracer une courbe avec matplotlib

02:41

Dans cette session, vous allez maîtriser l'art de tracer des courbes en utilisant matplotlib, un outil essentiel pour la visualisation de données en data science. Nous explorerons ensemble les différentes fonctionnalités offertes par cet outil pour optimiser la représentation graphique de vos données issues de pandas. Cette compétence vous permettra d'analyser davantage vos données et d'en tirer des conclusions pertinentes.

  • Sous-titres
  • Résumé textuel
Voir la session
D'autres types de graphiques

17. D'autres types de graphiques

03:16

Découvrez de nouveaux types de visualisations graphiques dans le domaine de la science des données en utilisant la bibliothèque pandas. Avec nous, vous allez apprendre à générer des graphiques plus complexes qui mettent en valeur vos analyses et aident à mieux comprendre vos données. Cette session vous offre un nouveau niveau d'expertise en visualisation de données avec pandas.

  • Sous-titres
  • Résumé textuel
Voir la session
Présentation du jeu de données Netflix

18. Présentation du jeu de données Netflix

01:21

Lors de cette session, vous allez explorer un jeu de données issu de Netflix en utilisant la bibliothèque pandas. Vous allez apprendre à importer les données, à les nettoyer et à les interpréter pour tirer les premières conclusions. Cette session vous aidera à poser les bases de votre expertise en science des données avec Python et pandas.

  • Sous-titres
  • Résumé textuel
Voir la session
Récupérer les trois pays les plus importants - Introduction

19. Récupérer les trois pays les plus importants - Introduction

01:23

Dans cette session, vous allez découvrir comment utiliser pandas, une bibliothèque centrale en data science, pour extraire et manipuler les informations précises d'un dataset. Plus concrètement, nous allons vous montrer comment récupérer les trois pays les plus importants à partir de vos données. Vous allez développer une compréhension pratique de l'utilisation des fonctions pandas pour filtrer, trier et obtenir des statistiques.

  • Sous-titres
  • Résumé textuel
Réservé aux membres Premium
Récupérer les trois pays les plus importants - Solution

20. Récupérer les trois pays les plus importants - Solution

03:21

  • Sous-titres
  • Résumé textuel
Réservé aux membres Premium
Récupérer le nombre de films par années - Introduction

21. Récupérer le nombre de films par années - Introduction

00:47

Au cours de cette session, vous allez découvrir comment manipuler et analyser des données de film pour obtenir des statistiques précises par année. À l'aide de la bibliothèque pandas, nous allons apprendre à agréger les informations afin d'extraire le nombre de films produits chaque année.

  • Sous-titres
  • Résumé textuel
Réservé aux membres Premium
Récupérer le nombre de films par années - Solution

22. Récupérer le nombre de films par années - Solution

02:09

  • Sous-titres
  • Résumé textuel
Réservé aux membres Premium
Récupérer la liste de tous les réalisateurs - Introduction

23. Récupérer la liste de tous les réalisateurs - Introduction

01:03

Lors de cette session, vous allez découvrir comment extraire une liste de tous les réalisateurs en utilisant justement pandas, bibliothèque Python dédiée à la manipulation de données. Nous nous pencherons sur l'importation de données, leur traitement et leur extraction spécifique pour répondre à des besoins précis en Data Science.

  • Sous-titres
  • Résumé textuel
Réservé aux membres Premium
Récupérer la liste de tous les réalisateurs - Solution

24. Récupérer la liste de tous les réalisateurs - Solution

03:16

  • Sous-titres
  • Résumé textuel
Réservé aux membres Premium
Récupérer la durée moyenne des films - Introduction

25. Récupérer la durée moyenne des films - Introduction

03:22

Dans cette session, vous allez explorer comment use de la bibliothèque pandas pour extraire des informations précises d'un ensemble de données. Plus précisément, nous nous concentrerons sur le calcul de la durée moyenne des films à l'aide de diverses techniques de manipulation de data frames. À la fin, vous serez en mesure de tirer efficacement des informations statistiques d'une base de données.

  • Sous-titres
  • Résumé textuel
Réservé aux membres Premium
Récupérer la durée moyenne des films - Solution

26. Récupérer la durée moyenne des films - Solution

05:44

  • Sous-titres
  • Résumé textuel
Réservé aux membres Premium

Rechercher sur le site

Formulaire de contact

Inscris-toi à Docstring

Pour commencer ton apprentissage.

Tu as déjà un compte ? Connecte-toi.