1. Définition du scraping de données

00:54

Vous allez découvrir le concept du scraping de données, une technique essentielle pour extraire des informations de sites web en utilisant Python.

Sous-titres
Résumé textuel

Voir la session

2. Les prérequis

02:06

Découvrez les outils essentiels pour débuter le scraping : configuration de l'environnement de travail, installation des bibliothèques requests et BeautifulSoup, et initiation aux concepts clés pour préparer votre ascension dans le monde du scraping de données.

Sous-titres
Résumé textuel

Voir la session

3. La solution Bright Data

02:11

Vous allez découvrir Bright Data, un outil avancé pour le scraping de données. Nous explorerons son fonctionnement et comment l'intégrer efficacement dans vos projets de scraping.

Sous-titres
Résumé textuel

Voir la session

4. Les librairies nécessaires

05:44

Découvrez les outils essentiels pour le scraping de données. Vous allez installer et configurer les bibliothèques requests et BeautifulSoup, prérequis indéniables à la maîtrise du scrapping.

Sous-titres
Résumé textuel

Voir la session

5. Récupérer le contenu d'une page avec requests

06:05

Vous allez découvrir comment récupérer le contenu HTML d'une page web grâce à la bibliothèque requests. Cette étape est fondamentale pour le scraping de données.

Sous-titres
Résumé textuel

Voir la session

6. Note sur le site BooksToScrape

01:19

Vous explorerez le site BooksToScrape pour appliquer vos connaissances en scrapping avec requests et BeautifulSoup, cernant les spécificités de cette plateforme.

Sous-titres
Résumé textuel

Voir la session

7. Analyser le contenu d'une page avec BeautifulSoup

07:42

Vous apprendrez à interpréter et analyser le contenu HTML d'une page web en utilisant la puissante bibliothèque BeautifulSoup. Nous aborderons les méthodes de recherche et de manipulation des données pour extraire efficacement les informations nécessaires.

Sous-titres
Résumé textuel

Voir la session

8. Récupérer des informations avec BeautifulSoup

09:19

Vous allez découvrir comment utiliser BeautifulSoup pour extraire efficacement des informations à partir de pages web. Nous aborderons les techniques de sélection des données souhaitées en parcourant le DOM.

Sous-titres
Résumé textuel

Voir la session

9. Analyser la page d'accueil des livres

11:48

Dans cette session, vous découvrirez comment analyser la structure HTML de la page d'accueil d’un site dédié aux livres en utilisant requests et BeautifulSoup. Vous allez extraire et interpréter les données essentielles grâce à ces outils puissants.

Sous-titres
Résumé textuel

Voir la session

10. À vous de jouer

09:32

Mettez en pratique vos connaissances des bibliothèques requests et BeautifulSoup. Vous allez extraire des données réelles du web et relever le défi de scraper efficacement une page de votre choix.

Sous-titres
Résumé textuel

Voir la session

11. Introduction aux exercices

01:09

Vous allez vous initier au scraping avec des exercices pratiques qui vous permettront de maîtriser les outils fondamentaux tels que requests et BeautifulSoup.

Sous-titres
Résumé textuel

Voir la session

12. Récupérer les catégories avec un seul livre

25:46

Apprenez à isoler les données de catégories à partir d'une page produit en utilisant Python. Dans cette session pratique, vous allez maîtriser l'art de récupérer des informations spécifiques avec requests et BeautifulSoup.

Sous-titres
Résumé textuel

Voir la session

13. Récupérer les livres notés 1 étoile

36:09

Découvrez comment extraire les livres notés 1 étoile en utilisant les bibliothèques requests et BeautifulSoup. Cette session vous initie à identifier et récupérer sélectivement des données spécifiques depuis le web.

Sous-titres
Résumé textuel

Voir la session

14. Introduction à l'exercice

00:46

Découvrez les fondamentaux du scraping de données en vous initiant aux techniques de base avec requests et BeautifulSoup. Initiez-vous à cet exercice incontournable.

Sous-titres
Résumé textuel

Voir la session

15. Objectif du script

01:10

Découvrez le but et l'approche stratégique du scraping de données. Nous aborderons ensemble la définition des objectifs afin d'orienter efficacement le développement de votre script.

Sous-titres
Résumé textuel

Voir la session

16. Présentation de selectolax et loguru

07:35

Vous allez découvrir selectolax pour analyser efficacement le HTML et loguru pour une gestion avancée des logs. Cette session enrichira vos compétences en scraping.

Sous-titres
Résumé textuel

Voir la session

17. Préparation d'un cahier des charges

10:24

Vous allez établir un cahier des charges précis pour votre projet de scraping, définissant vos objectifs et structurant votre approche.

Sous-titres
Résumé textuel

Voir la session

18. Création du corps du script

19:10

Apprenez à structurer le cœur d'un script de scraping performant. Vous allez créer le squelette de code nécessaire pour utiliser efficacement requests et BeautifulSoup, en posant les bases de vos futurs projets de collecte de données.

Sous-titres
Résumé textuel

Voir la session

19. Récupération du prix d'un livre

24:51

Découvrez comment extraire le prix d'un livre depuis le Web en utilisant requests et BeautifulSoup. Cette session vous guide dans la récupération des données financières précises.

Sous-titres
Résumé textuel

Voir la session

20. Récupérer toutes les URL sur une page

12:02

Apprenez à extraire efficacement toutes les URL présentes sur une page web en utilisant Python. Nous explorerons l'usage des bibliothèques requests et BeautifulSoup pour parcourir le contenu HTML et isoler les liens.

Sous-titres
Résumé textuel

Voir la session

21. Récupérer l'URL de la prochaine page

06:02

Maîtrisez l'art de naviguer dans les structures de pagination web en apprenant à récupérer automatiquement l'URL de la prochaine page avec requests et BeautifulSoup.

Sous-titres
Résumé textuel

Voir la session

22. Récupérer toutes les URL de la librairie

07:46

Dans cette session, vous allez découvrir comment récupérer efficacement toutes les URL présentes sur une page web à l'aide de requests et BeautifulSoup. Nous explorerons les techniques pour extraire les données de liens et structurer les informations recueillies.

Sous-titres
Résumé textuel

Voir la session

23. Récupérer la valeur totale de la bibliothèque

08:02

Découvrez comment extraire la valeur totale de ressources d'une bibliothèque en ligne en utilisant Python. Nous allons manipuler requests et BeautifulSoup pour interroger et analyser efficacement des données web.

Sous-titres
Résumé textuel

Voir la session

24. Optimisation de notre script avec les sessions

06:15

Optimisez vos scripts de scraping en utilisant les sessions de requests pour maintenir des connexions persistantes et améliorer l'efficacité de vos requêtes. Vous allez découvrir comment réduire le temps de chargement et accroître la performance de vos extractions de données.

Sous-titres
Résumé textuel

Voir la session

25. Conclusion

00:26

Vous allez consolider vos connaissances acquises en scraping de données et découvrir comment mettre ces compétences en pratique dans divers projets. Nous ferons le point sur tous les concepts clés appris et vous donnerons des conseils pour vos futurs projets de data scraping.

Sous-titres
Résumé textuel

Voir la session

Les bases du scrapping de données

1. Définition du scraping de données

2. Les prérequis

3. La solution Bright Data

4. Les librairies nécessaires

5. Récupérer le contenu d'une page avec requests

6. Note sur le site BooksToScrape

7. Analyser le contenu d'une page avec BeautifulSoup

8. Récupérer des informations avec BeautifulSoup

9. Analyser la page d'accueil des livres

10. À vous de jouer

11. Introduction aux exercices

12. Récupérer les catégories avec un seul livre

13. Récupérer les livres notés 1 étoile

14. Introduction à l'exercice

15. Objectif du script

16. Présentation de selectolax et loguru

17. Préparation d'un cahier des charges

18. Création du corps du script

19. Récupération du prix d'un livre

20. Récupérer toutes les URL sur une page

21. Récupérer l'URL de la prochaine page

22. Récupérer toutes les URL de la librairie

23. Récupérer la valeur totale de la bibliothèque

24. Optimisation de notre script avec les sessions

25. Conclusion

Rechercher sur le site

Formulaire de contact