Les bases du scrapping de données

Dans cette formation, vous allez apprendre toutes les bases du scraping de données avec les bibliothèques requests et BeautifulSoup.
Commencer le la formation play_circle
  • grade grade grade
    Débutant
  • schedule 3 heures 44 minutes
  • list 25 sessions
Définition du scraping de données

1. Définition du scraping de données

schedule

00:54

Vous allez découvrir le concept du scraping de données, une technique essentielle pour extraire des informations de sites web en utilisant Python.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Les prérequis

2. Les prérequis

schedule

02:06

Découvrez les outils essentiels pour débuter le scraping : configuration de l'environnement de travail, installation des bibliothèques requests et BeautifulSoup, et initiation aux concepts clés pour préparer votre ascension dans le monde du scraping de données.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
La solution Bright Data

3. La solution Bright Data

schedule

02:11

Vous allez découvrir Bright Data, un outil avancé pour le scraping de données. Nous explorerons son fonctionnement et comment l'intégrer efficacement dans vos projets de scraping.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Les librairies nécessaires

4. Les librairies nécessaires

schedule

05:44

Découvrez les outils essentiels pour le scraping de données. Vous allez installer et configurer les bibliothèques requests et BeautifulSoup, prérequis indéniables à la maîtrise du scrapping.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Récupérer le contenu d'une page avec requests

5. Récupérer le contenu d'une page avec requests

schedule

06:05

Vous allez découvrir comment récupérer le contenu HTML d'une page web grâce à la bibliothèque requests. Cette étape est fondamentale pour le scraping de données.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Note sur le site BooksToScrape

6. Note sur le site BooksToScrape

schedule

01:19

Vous explorerez le site BooksToScrape pour appliquer vos connaissances en scrapping avec requests et BeautifulSoup, cernant les spécificités de cette plateforme.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Analyser le contenu d'une page avec BeautifulSoup

7. Analyser le contenu d'une page avec BeautifulSoup

schedule

07:42

Vous apprendrez à interpréter et analyser le contenu HTML d'une page web en utilisant la puissante bibliothèque BeautifulSoup. Nous aborderons les méthodes de recherche et de manipulation des données pour extraire efficacement les informations nécessaires.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Récupérer des informations avec BeautifulSoup

8. Récupérer des informations avec BeautifulSoup

schedule

09:19

Vous allez découvrir comment utiliser BeautifulSoup pour extraire efficacement des informations à partir de pages web. Nous aborderons les techniques de sélection des données souhaitées en parcourant le DOM.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Analyser la page d'accueil des livres

9. Analyser la page d'accueil des livres

schedule

11:48

Dans cette session, vous découvrirez comment analyser la structure HTML de la page d'accueil d’un site dédié aux livres en utilisant requests et BeautifulSoup. Vous allez extraire et interpréter les données essentielles grâce à ces outils puissants.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
À vous de jouer

10. À vous de jouer

schedule

09:32

Mettez en pratique vos connaissances des bibliothèques requests et BeautifulSoup. Vous allez extraire des données réelles du web et relever le défi de scraper efficacement une page de votre choix.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Introduction aux exercices

11. Introduction aux exercices

schedule

01:09

Vous allez vous initier au scraping avec des exercices pratiques qui vous permettront de maîtriser les outils fondamentaux tels que requests et BeautifulSoup.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Récupérer les catégories avec un seul livre

12. Récupérer les catégories avec un seul livre

schedule

25:46

Apprenez à isoler les données de catégories à partir d'une page produit en utilisant Python. Dans cette session pratique, vous allez maîtriser l'art de récupérer des informations spécifiques avec requests et BeautifulSoup.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Récupérer les livres notés 1 étoile

13. Récupérer les livres notés 1 étoile

schedule

36:09

Découvrez comment extraire les livres notés 1 étoile en utilisant les bibliothèques requests et BeautifulSoup. Cette session vous initie à identifier et récupérer sélectivement des données spécifiques depuis le web.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Introduction à l'exercice

14. Introduction à l'exercice

schedule

00:46

Découvrez les fondamentaux du scraping de données en vous initiant aux techniques de base avec requests et BeautifulSoup. Initiez-vous à cet exercice incontournable.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Objectif du script

15. Objectif du script

schedule

01:10

Découvrez le but et l'approche stratégique du scraping de données. Nous aborderons ensemble la définition des objectifs afin d'orienter efficacement le développement de votre script.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Présentation de selectolax et loguru

16. Présentation de selectolax et loguru

schedule

07:35

Vous allez découvrir selectolax pour analyser efficacement le HTML et loguru pour une gestion avancée des logs. Cette session enrichira vos compétences en scraping.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Préparation d'un cahier des charges

17. Préparation d'un cahier des charges

schedule

10:24

Vous allez établir un cahier des charges précis pour votre projet de scraping, définissant vos objectifs et structurant votre approche.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Création du corps du script

18. Création du corps du script

schedule

19:10

Apprenez à structurer le cœur d'un script de scraping performant. Vous allez créer le squelette de code nécessaire pour utiliser efficacement requests et BeautifulSoup, en posant les bases de vos futurs projets de collecte de données.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Récupération du prix d'un livre

19. Récupération du prix d'un livre

schedule

24:51

Découvrez comment extraire le prix d'un livre depuis le Web en utilisant requests et BeautifulSoup. Cette session vous guide dans la récupération des données financières précises.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Récupérer toutes les URL sur une page

20. Récupérer toutes les URL sur une page

schedule

12:02

Apprenez à extraire efficacement toutes les URL présentes sur une page web en utilisant Python. Nous explorerons l'usage des bibliothèques requests et BeautifulSoup pour parcourir le contenu HTML et isoler les liens.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Récupérer l'URL de la prochaine page

21. Récupérer l'URL de la prochaine page

schedule

06:02

Maîtrisez l'art de naviguer dans les structures de pagination web en apprenant à récupérer automatiquement l'URL de la prochaine page avec requests et BeautifulSoup.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Récupérer toutes les URL de la librairie

22. Récupérer toutes les URL de la librairie

schedule

07:46

Dans cette session, vous allez découvrir comment récupérer efficacement toutes les URL présentes sur une page web à l'aide de requests et BeautifulSoup. Nous explorerons les techniques pour extraire les données de liens et structurer les informations recueillies.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Récupérer la valeur totale de la bibliothèque

23. Récupérer la valeur totale de la bibliothèque

schedule

08:02

Découvrez comment extraire la valeur totale de ressources d'une bibliothèque en ligne en utilisant Python. Nous allons manipuler requests et BeautifulSoup pour interroger et analyser efficacement des données web.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Optimisation de notre script avec les sessions

24. Optimisation de notre script avec les sessions

schedule

06:15

Optimisez vos scripts de scraping en utilisant les sessions de requests pour maintenir des connexions persistantes et améliorer l'efficacité de vos requêtes. Vous allez découvrir comment réduire le temps de chargement et accroître la performance de vos extractions de données.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right
Conclusion

25. Conclusion

schedule

00:26

Vous allez consolider vos connaissances acquises en scraping de données et découvrir comment mettre ces compétences en pratique dans divers projets. Nous ferons le point sur tous les concepts clés appris et vous donnerons des conseils pour vos futurs projets de data scraping.

  • closed_caption Sous-titres check_circle
  • format_quote Résumé textuel cancel
Voir la session chevron_right

Rechercher sur le site

open_in_new

Formulaire de contact

Inscris-toi à Docstring

Pour commencer ton apprentissage.

Tu as déjà un compte ? Connecte-toi.