1. Introduction à la formation

01:51

Lors de cette première rencontre, vous allez découvrir le monde fascinant de la data science à travers la bibliothèque pandas. Nous allons nous plonger dans les notions fondamentales de cette discipline en s'appuyant sur l'outil pandas, véritable référence dans le domaine. Vous allez bientôt maîtriser les bases de la manipulation de données, un savoir-faire indispensable pour tout data scientist en devenir.

Sous-titres
Résumé textuel

Voir la session

2. Les fichiers sources

00:29

Durant cette session, vous allez découvrir tous les fichiers sources essentiels de notre formation dédiée aux bases de la data science avec pandas. En approfondissant le contenu partagé sur le dépôt Github, vous serez en mesure de mieux comprendre et de suivre chaque partie de notre programme d'apprentissage.

Sous-titres
Résumé textuel

Voir la session

3. Qu'est-ce que la science des données ?

06:02

Vous allez découvrir dans cette session le monde fascinant de la science des données. Vous comprendrez son importance dans le décodage des informations complexes et son application dans notre quotidien. Des concepts clés seront introduits pour vous donner une solide compréhension de ce qu'est la science des données et pourquoi elle est cruciale dans notre ère numérique actuelle. Nous allons également aborder les perspectives de carrière qu'elle offre.

Sous-titres
Résumé textuel

Voir la session

4. Configuration de Jupyter Lab sur Windows

03:55

Vous allez débuter votre voyage dans la science de données en installant et configurant Jupyter Lab sur Windows. Nous allons vous guider pas à pas pour effectuer une installation réussie et sans complications techniques. Vous allez apprendre à préparer un environnement de travail efficace et approprié pour manipuler la bibliothèque pandas.

Sous-titres
Résumé textuel

Voir la session

5. Configuration de Jupyter Lab sur Linux

00:33

Dans cette session, vous allez découvrir comment installer et configurer Jupyter Lab sur un système Linux. Cette étape est essentielle pour maîtriser l'outil de base de la data science, Pandas. Nous allons aborder l'installation via pip et le terminal, capacité qui se révèlera précieuse pour d'autres environnements de développement. C'est un prérequis crucial pour les prochaines sessions.

Sous-titres
Résumé textuel

Voir la session

6. Configuration de Jupyter Lab sur Mac OS

03:36

Lors de cette session, vous allez installer et configurer Jupyter Lab, un environnement de travail utilisé en Data Science, sur votre système d'exploitation Mac OS. Vous vous familiariserez avec son interface et les fonctionnalités clés pour commencer à travailler avec la bibliothèque Pandas. Nous aborderons également la gestion des erreurs courantes lors de l'installation.

Sous-titres
Résumé textuel

Voir la session

7. Lire un fichier CSV avec pandas

06:14

Au cours de cette session, vous allez plonger dans les fonctionnalités de base de la bibliothèque pandas. De manière précise, vous allez apprendre comment lire un fichier CSV de manière efficace avec pandas. Nous allons ensemble explorer l'importance des données CSV en science des données et comment les manipuler avec pandas. Vous serez bientôt capable de charger, lire et comprendre les jeux de données en format CSV.

Sous-titres
Résumé textuel

Voir la session

8. Analyser le dataframe

07:21

Dans cette session, vous allez découvrir comment analyser effectivement un dataframe avec pandas. Vous allez explorer les différentes méthodes pour examiner, trier et filtrer les données. De plus, nous allons voir comment manipuler la structure d'un dataframe pour aider à extraire des informations utiles. Cette étape cruciale vous aidera à préparer vos données pour une analyse plus approfondie et à obtenir des résultats précis.

Sous-titres
Résumé textuel

Voir la session

9. Sélectionner des données

09:24

Dans cette session, vous allez maîtriser comment sélectionner des données spécifiques à l'aide de la bibliothèque pandas. Nous allons explorer les différentes techniques pour filtrer et affiner vos jeux de données. Préparez-vous à plonger dans le monde fascinant de la manipulation des données, la pièce maîtresse de la science des données.

Sous-titres
Résumé textuel

Voir la session

10. Les filtres

08:48

Dans cette session, vous allez découvrir comment utiliser efficacement les filtres dans pandas pour manipuler et analyser des ensembles de données. Nous allons apprendre à extraire des informations précises, à filtrer des données spécifiques et à comprendre l'importance des filtres en data science.

Sous-titres
Résumé textuel

Voir la session

11. Supprimer une colonne

04:52

Dans cette session, vous allez découvrir comment supprimer une colonne dans votre dataframe en utilisant la bibliothèque pandas. Nous allons aborder les différents moyens d'éliminer les colonnes inutiles pour simplifier l'analyse de vos données. Vous apprendrez aussi à maîtriser les erreurs Classiques lors de ce processus.

Sous-titres
Résumé textuel

Voir la session

12. Traiter les valeurs manquantes

07:19

Dans cette session, vous vous familiariserez avec les techniques de gestion des valeurs manquantes. Vous allez apprendre comment identifier les données manquantes dans votre série ou DataFrame pandas, comment les gérer adéquatement en les éliminant ou en les remplaçant, pour obtenir des analyses de données fiables. Nous allons également explorer les stratégies différentes à utiliser selon le contexte.

Sous-titres
Résumé textuel

Voir la session

13. Ajouter des colonnes

07:39

Dans cette session, vous allez découvrir comment ajouter des colonnes à vos bases de données en utilisant la bibliothèque pandas. Nous allons parcourir ensemble les différentes méthodes et techniques pour manipuler efficacement vos données. Ce sera un atout clé pour approfondir vos compétences en science des données.

Sous-titres
Résumé textuel

Voir la session

14. Analyser les données

11:27

Dans cette session, vous allez vous familiariser avec l'analyse de données en utilisant la bibliothèque pandas, un outil crucial en data science. Vous allez comprendre comment examiner, nettoyer et transformer vos données pour faciliter leur analyse. Nous allons explorer ensemble les méthodes de manipulation et de visualisation offertes par pandas.

Sous-titres
Résumé textuel

Voir la session

15. Installation de matplotlib

01:14

Au fil de cette session, vous allez installer et explorer les fonctionnalités de Matplotlib. Vous découvrirez comment ce module s'intègre dans la bibliothèque pandas et son importance cruciale pour la visualisation de données en science des données. Nous allons aussi aborder ses aspects pratiques qui facilitent le traitement des données complexes.

Sous-titres
Résumé textuel

Voir la session

16. Tracer une courbe avec matplotlib

02:41

Dans cette session, vous allez maîtriser l'art de tracer des courbes en utilisant matplotlib, un outil essentiel pour la visualisation de données en data science. Nous explorerons ensemble les différentes fonctionnalités offertes par cet outil pour optimiser la représentation graphique de vos données issues de pandas. Cette compétence vous permettra d'analyser davantage vos données et d'en tirer des conclusions pertinentes.

Sous-titres
Résumé textuel

Voir la session

17. D'autres types de graphiques

03:16

Découvrez de nouveaux types de visualisations graphiques dans le domaine de la science des données en utilisant la bibliothèque pandas. Avec nous, vous allez apprendre à générer des graphiques plus complexes qui mettent en valeur vos analyses et aident à mieux comprendre vos données. Cette session vous offre un nouveau niveau d'expertise en visualisation de données avec pandas.

Sous-titres
Résumé textuel

Voir la session

18. Présentation du jeu de données Netflix

01:21

Lors de cette session, vous allez explorer un jeu de données issu de Netflix en utilisant la bibliothèque pandas. Vous allez apprendre à importer les données, à les nettoyer et à les interpréter pour tirer les premières conclusions. Cette session vous aidera à poser les bases de votre expertise en science des données avec Python et pandas.

Sous-titres
Résumé textuel

Voir la session

19. Récupérer les trois pays les plus importants - Introduction

01:23

Dans cette session, vous allez découvrir comment utiliser pandas, une bibliothèque centrale en data science, pour extraire et manipuler les informations précises d'un dataset. Plus concrètement, nous allons vous montrer comment récupérer les trois pays les plus importants à partir de vos données. Vous allez développer une compréhension pratique de l'utilisation des fonctions pandas pour filtrer, trier et obtenir des statistiques.

Sous-titres
Résumé textuel

Réservé aux membres Premium

20. Récupérer les trois pays les plus importants - Solution

03:21

Sous-titres
Résumé textuel

Réservé aux membres Premium

21. Récupérer le nombre de films par années - Introduction

00:47

Au cours de cette session, vous allez découvrir comment manipuler et analyser des données de film pour obtenir des statistiques précises par année. À l'aide de la bibliothèque pandas, nous allons apprendre à agréger les informations afin d'extraire le nombre de films produits chaque année.

Sous-titres
Résumé textuel

Réservé aux membres Premium

22. Récupérer le nombre de films par années - Solution

02:09

Sous-titres
Résumé textuel

Réservé aux membres Premium

23. Récupérer la liste de tous les réalisateurs - Introduction

01:03

Lors de cette session, vous allez découvrir comment extraire une liste de tous les réalisateurs en utilisant justement pandas, bibliothèque Python dédiée à la manipulation de données. Nous nous pencherons sur l'importation de données, leur traitement et leur extraction spécifique pour répondre à des besoins précis en Data Science.

Sous-titres
Résumé textuel

Réservé aux membres Premium

24. Récupérer la liste de tous les réalisateurs - Solution

03:16

Sous-titres
Résumé textuel

Réservé aux membres Premium

25. Récupérer la durée moyenne des films - Introduction

03:22

Dans cette session, vous allez explorer comment use de la bibliothèque pandas pour extraire des informations précises d'un ensemble de données. Plus précisément, nous nous concentrerons sur le calcul de la durée moyenne des films à l'aide de diverses techniques de manipulation de data frames. À la fin, vous serez en mesure de tirer efficacement des informations statistiques d'une base de données.

Sous-titres
Résumé textuel

Réservé aux membres Premium

26. Récupérer la durée moyenne des films - Solution

05:44

Sous-titres
Résumé textuel

Réservé aux membres Premium

Les bases de la data science avec pandas

1. Introduction à la formation

2. Les fichiers sources

3. Qu'est-ce que la science des données ?

4. Configuration de Jupyter Lab sur Windows

5. Configuration de Jupyter Lab sur Linux

6. Configuration de Jupyter Lab sur Mac OS

7. Lire un fichier CSV avec pandas

8. Analyser le dataframe

9. Sélectionner des données

10. Les filtres

11. Supprimer une colonne

12. Traiter les valeurs manquantes

13. Ajouter des colonnes

14. Analyser les données

15. Installation de matplotlib

16. Tracer une courbe avec matplotlib

17. D'autres types de graphiques

18. Présentation du jeu de données Netflix

19. Récupérer les trois pays les plus importants - Introduction

20. Récupérer les trois pays les plus importants - Solution

21. Récupérer le nombre de films par années - Introduction

22. Récupérer le nombre de films par années - Solution

23. Récupérer la liste de tous les réalisateurs - Introduction

24. Récupérer la liste de tous les réalisateurs - Solution

25. Récupérer la durée moyenne des films - Introduction

26. Récupérer la durée moyenne des films - Solution

Rechercher sur le site

Formulaire de contact