Les bases de la data science avec pandas

Découvre les bases de la science des données avec la bibliothèque pandas.

  • Débutant
  • fiber_manual_record
  • 1 heures 33 minutes
  • fiber_manual_record
  • 22 sessions
Introduction à la formation

01:51

1. Introduction à la formation

Lors de cette première rencontre, vous allez découvrir le monde fascinant de la data science à travers la bibliothèque pandas. Nous allons nous plonger dans les notions fondamentales de cette discipline en s'appuyant sur l'outil pandas, véritable référence dans le domaine. Vous allez bientôt maîtriser les bases de la manipulation de données, un savoir-faire indispensable pour tout data scientist en devenir.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Qu'est-ce que la science des données ?

06:02

3. Qu'est-ce que la science des données ?

Vous allez découvrir dans cette session le monde fascinant de la science des données. Vous comprendrez son importance dans le décodage des informations complexes et son application dans notre quotidien. Des concepts clés seront introduits pour vous donner une solide compréhension de ce qu'est la science des données et pourquoi elle est cruciale dans notre ère numérique actuelle. Nous allons également aborder les perspectives de carrière qu'elle offre.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Configuration de Jupyter Lab sur Linux

00:33

5. Configuration de Jupyter Lab sur Linux

Dans cette session, vous allez découvrir comment installer et configurer Jupyter Lab sur un système Linux. Cette étape est essentielle pour maîtriser l'outil de base de la data science, Pandas. Nous allons aborder l'installation via pip et le terminal, capacité qui se révèlera précieuse pour d'autres environnements de développement. C'est un prérequis crucial pour les prochaines sessions.

  • closed_caption Sous-titres cancel
  • format_quote Résumé textuel cancel
Configuration de Jupyter Lab sur Mac OS

03:36

6. Configuration de Jupyter Lab sur Mac OS

Lors de cette session, vous allez installer et configurer Jupyter Lab, un environnement de travail utilisé en Data Science, sur votre système d'exploitation Mac OS. Vous vous familiariserez avec son interface et les fonctionnalités clés pour commencer à travailler avec la bibliothèque Pandas. Nous aborderons également la gestion des erreurs courantes lors de l'installation.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Lire un fichier CSV avec pandas

06:15

7. Lire un fichier CSV avec pandas

Au cours de cette session, vous allez plonger dans les fonctionnalités de base de la bibliothèque pandas. De manière précise, vous allez apprendre comment lire un fichier CSV de manière efficace avec pandas. Nous allons ensemble explorer l'importance des données CSV en science des données et comment les manipuler avec pandas. Vous serez bientôt capable de charger, lire et comprendre les jeux de données en format CSV.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Analyser le dataframe

07:21

8. Analyser le dataframe

Dans cette session, vous allez découvrir comment analyser effectivement un dataframe avec pandas. Vous allez explorer les différentes méthodes pour examiner, trier et filtrer les données. De plus, nous allons voir comment manipuler la structure d'un dataframe pour aider à extraire des informations utiles. Cette étape cruciale vous aidera à préparer vos données pour une analyse plus approfondie et à obtenir des résultats précis.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Traiter les valeurs manquantes

07:19

12. Traiter les valeurs manquantes

Dans cette session, vous vous familiariserez avec les techniques de gestion des valeurs manquantes. Vous allez apprendre comment identifier les données manquantes dans votre série ou DataFrame pandas, comment les gérer adéquatement en les éliminant ou en les remplaçant, pour obtenir des analyses de données fiables. Nous allons également explorer les stratégies différentes à utiliser selon le contexte.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Tracer une courbe avec matplotlib

02:42

16. Tracer une courbe avec matplotlib

Dans cette session, vous allez maîtriser l'art de tracer des courbes en utilisant matplotlib, un outil essentiel pour la visualisation de données en data science. Nous explorerons ensemble les différentes fonctionnalités offertes par cet outil pour optimiser la représentation graphique de vos données issues de pandas. Cette compétence vous permettra d'analyser davantage vos données et d'en tirer des conclusions pertinentes.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
D'autres types de graphiques

03:17

17. D'autres types de graphiques

Découvrez de nouveaux types de visualisations graphiques dans le domaine de la science des données en utilisant la bibliothèque pandas. Avec nous, vous allez apprendre à générer des graphiques plus complexes qui mettent en valeur vos analyses et aident à mieux comprendre vos données. Cette session vous offre un nouveau niveau d'expertise en visualisation de données avec pandas.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Récupérer les trois pays les plus importants

01:24

19. Récupérer les trois pays les plus importants

Dans cette session, vous allez découvrir comment utiliser pandas, une bibliothèque centrale en data science, pour extraire et manipuler les informations précises d'un dataset. Plus concrètement, nous allons vous montrer comment récupérer les trois pays les plus importants à partir de vos données. Vous allez développer une compréhension pratique de l'utilisation des fonctions pandas pour filtrer, trier et obtenir des statistiques.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Récupérer la durée moyenne des films

03:22

22. Récupérer la durée moyenne des films

Dans cette session, vous allez explorer comment use de la bibliothèque pandas pour extraire des informations précises d'un ensemble de données. Plus précisément, nous nous concentrerons sur le calcul de la durée moyenne des films à l'aide de diverses techniques de manipulation de data frames. À la fin, vous serez en mesure de tirer efficacement des informations statistiques d'une base de données.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel