Session du 22 septembre 2022 à 20h00
Data Science & IA
Deviens membre Premium magic_button
Cette session de mentorat est réservée aux membres Premium. Rejoignez-nous pour accéder à toutes les rediffusions des sessions de mentorat !
Premium
- check +100h de formations
- check +180 exercices de code
- check +100h de mentorats en rediffusion
- check 20 projets
- check Mentorats groupés hebdomadaires
- check Support individuel avec nos mentors
Scraper des prénoms avec BeautifulSoup et pandas
Cette vidéo montre comment récupérer automatiquement des prénoms depuis une page Wikipédia grâce au duo requests et BeautifulSoup. On y voit comment analyser le HTML, choisir les bons sélecteurs et construire une « soupe » exploitable. Les données extraites sont ensuite utilisées pour créer un DataFrame pandas contenant prénoms, salaires et primes fictives. L’accent est mis sur une approche pratique du web scraping pour générer rapidement un jeu de données exploitable en data science.
Introduction à la session de mentorat
Présentation de l'environnement virtuel et des librairies
Récupération de contenu HTML avec Beautiful Soup
Scraper des noms à partir d'un site
Création du data frame à partir des données scrappées
Génération de salaires aléatoires
Ajout des dates d'embauche
Création et fusion de data frames
Utilisation de la fonction merge pour fusionner les données
Ajout de coefficients selon les métiers
Agrégation et analyse des données
Présentation de pandas profiling