Session du 22 septembre 2022 à 20h00

Data Science & IA

Deviens membre Premium magic_button

Cette session de mentorat est réservée aux membres Premium. Rejoignez-nous pour accéder à toutes les rediffusions des sessions de mentorat !

Premium

  • check +100h de formations
  • check +180 exercices de code
  • check +100h de mentorats en rediffusion
  • check 20 projets
  • check Mentorats groupés hebdomadaires
  • check Support individuel avec nos mentors
Découvrir les formules
Voir le détail des fonctionnalités

Scraper des prénoms avec BeautifulSoup et pandas

Cette vidéo montre comment récupérer automatiquement des prénoms depuis une page Wikipédia grâce au duo requests et BeautifulSoup. On y voit comment analyser le HTML, choisir les bons sélecteurs et construire une « soupe » exploitable. Les données extraites sont ensuite utilisées pour créer un DataFrame pandas contenant prénoms, salaires et primes fictives. L’accent est mis sur une approche pratique du web scraping pour générer rapidement un jeu de données exploitable en data science.

00:00:24

Introduction à la session de mentorat

00:01:02

Présentation de l'environnement virtuel et des librairies

00:02:01

Récupération de contenu HTML avec Beautiful Soup

00:03:28

Scraper des noms à partir d'un site

00:05:50

Création du data frame à partir des données scrappées

00:09:36

Génération de salaires aléatoires

00:12:12

Ajout des dates d'embauche

00:16:16

Création et fusion de data frames

00:19:00

Utilisation de la fonction merge pour fusionner les données

00:27:03

Ajout de coefficients selon les métiers

00:33:06

Agrégation et analyse des données

00:42:00

Présentation de pandas profiling

Bravo, tu es prêt à passer à la suite

Rechercher sur le site

Formulaire de contact

Inscris-toi à Docstring

Pour commencer ton apprentissage.

Tu as déjà un compte ? Connecte-toi.