Inscris-toi
(c'est gratuit !)
Un compte est nécessaire pour participer aux discussions.
Créer un compte00:00:00 :Avant de rentrer dans le vif du sujet et dans le code, on va prendre quelques minutes pourparler de la préparation du projet et de la stack technique qu'on va utiliser.
00:00:07 :Il y a des informations importantes ici à prendre en compte avant de commencer doncne passez pas cette partie.La toute première chose qu'on va prendre en compte et on va le faire assez rapidementc'est de faire un scrapping qu'on appelle éthique.
00:00:20 :Il y a pas mal de règles à respecter dans le scrapping si on ne veut pas faire quelquechose qui peut être considéré comme illégal.
00:00:26 :Beaucoup de gens ne font tout simplement pas de scrapping parce qu'ils pensent quel'activité est totalement illégale mais ce n'est pas le cas quand on le fait bien.
00:00:32 :Donc c'est vraiment un point que j'essaye d'amener dans mes vidéos pour vous montrerque si on fait les choses bien, il n'y a aucun problème à faire du scrapping.
00:00:39 :La première chose à vérifier c'est s'il existe une API publique qui nous permet defaire ce que l'on souhaite faire avant de passer par du scrapping.
00:00:45 :Pour ce projet, ce n'est pas le cas.En fait, les sites des cinémas utilisent plein de systèmes différents, ça dépenddes villes, ça dépend des pays et dans notre cas il n'y a pas d'API publique unifiéequi nous permet de récupérer ces informations.
00:00:57 :Donc si une API documentée et publique existait, il serait préférable autant pour nous quepour le site en question de l'utiliser puisque ça éviterait de faire des requêtes quine sont pas nécessaires sur le site pour scrapper les données.
00:01:10 :La deuxième chose qu'on va faire c'est indiquer nos intentions et un moyen de nouscontacter via le user agent.Donc ça c'est quelque chose qu'on peut modifier quand on fait nos requêtes pourindiquer qui fait la requête.
00:01:20 :Dans notre cas, on va donc indiquer qu'on est un scrapper de cinéma et on va mettreune adresse email de contact pour que si jamais le détenteur du site souhaite nouscontacter, il puisse le faire.
00:01:31 :La troisième chose qu'on va mettre en place c'est un rythme de scrapping raisonnablepuisque quand on fait un script et en utilisant les bibliothèques qu'on veut utiliser,on pourrait potentiellement faire des centaines de requêtes à la seconde et ce n'est pasce qu'on veut faire puisqu'on ne veut pas surcharger le site et être potentiellement
00:01:46 :accusé de faire du DDoS, donc de l'attaque de déni de service.Donc là encore pour rester dans les clous, ne pas avoir de problème et faire un scrappingéthique, on va mettre en place un système qui va nous permettre d'effectuer des requêtesavec un délai entre chaque requête pour émuler un comportement qu'on pourrait avoir
00:02:01 :à la main.Et pour finir, la dernière chose qu'on va prendre en compte c'est le respect des droitsd'auteur et des données qu'on va récupérer, donc bien vous assurer à chaque fois quevous ne récupérez pas des données qui ne sont pas accessibles publiquement, par exemplesi vous avez besoin de payer pour un service ou de vous connecter à un service ou un site
00:02:16 :pour récupérer ces données, ces données ne sont donc pas publiques.Dans notre cas, ça va être des données auxquelles on peut accéder sans avoir besoinde créer ou de se connecter à un compte, ce sont donc des données publiques et onva les utiliser pour notre propre usage, donc on ne va pas présenter ces données comme
00:02:30 :si c'était des données que l'on avait créées et qu'on pourrait par exemple revendre.Donc ce n'est pas le but ici et donc on va respecter de cette façon les droits d'auteuret les données qu'on va récupérer.
00:02:39 :Deuxième point important dont je vais vous parler, c'est la stack technique que j'aichoisi pour ce projet.Bien évidemment, vous ne serez pas surpris, j'ai choisi d'utiliser Python avec notammentle module Request qui va nous permettre de faire des requêtes vers le site pour récupérerles informations.
00:02:53 :Vous verrez dans les prochaines parties qu'on ne va pas utiliser des outils plus avancéscomme Playwright qui nous permettent d'utiliser des navigateurs pour exécuter le Javascript,dans ce cas-ci on n'en aura pas besoin.
00:03:02 :On va également utiliser un éditeur qui est assez nouveau qui s'appelle Cursor, vousen avez peut-être déjà entendu parler, c'est un éditeur de code qui se base surVisual Studio Code, donc si vous utilisez VS Code vous ne serez pas perdu et il a laparticularité d'inclure des intelligences artificielles, notamment Cloud de Anthropic,
00:03:20 :Cloud 3.5 SunEdge qu'on va utiliser dans ce cas-ci, qui va nous permettre d'écrirenotre code.C'est là où ce tutoriel se démarque un petit peu de ce que vous avez pu voir auparavantc'est-à-dire qu'on va vraiment utiliser beaucoup de promptes.
00:03:33 :J'ai beaucoup réfléchi avant de faire cette formation et je ne me voyais pas vous faireécrire des lignes les unes à la suite des autres puisque ce n'est plus comme ça qu'oncode en 2025.
00:03:41 :Les choses bougent rapidement, je sais que beaucoup sont un petit peu stressés de voirqu'on n'écrit plus des lignes de code mais vous allez voir que le développeur a encoretotalement la main sur le code final qui va être produit et il y a beaucoup d'étapeset de choses qu'on va devoir faire même si ce n'est pas nous qui écrivons la majorité
00:03:56 :des lignes de code.Et dans les derniers outils qu'on va utiliser il y en a un qui me permet d'écrire lespromptes en les dictant à la voix c'est Super Whisper, alors il y en a pas mal d'autresqui existent par exemple sur Mac il y a aussi Better Dictation qui est très connu.
00:04:09 :Ces outils il en existe plein, tout comme Cursor il y a d'autres éditeurs qui existentaujourd'hui qui utilisent l'intelligence artificielle donc ne vous focalisez pas surl'outil qu'on va utiliser même pour Python en fait tout ce qu'on fait ici on pourraitéventuellement le faire avec des bibliothèques javascript qui permettent également de faire
00:04:25 :du scrapping.Donc tous ces outils pourraient très bien être remplacés par d'autres outils qui vontde toute façon être améliorés ou modifiés dans les mois et les années à venir puisquecomme je vous ai dit tout va très très vite en ce moment donc l'important c'est biende se focaliser sur les concepts qu'on va voir parce que ces concepts vous allez pouvoir
00:04:43 :les exporter peu importe l'éditeur que vous utilisez ce qui va être intéressant icic'est comment on fait du scrapping, comment on organise notre code et comment on s'assured'avoir un code qui va être facile à maintenir sur le long terme.
00:04:54 :Dans tout ça quel est le rôle de l'IA ? Quel est le rôle que va jouer l'IA dans cetteformation ? Et bien l'IA elle va être notre assistant, elle va écrire vous allez voir
00:05:03 :la majorité du code mais ça ne veut pas dire que nous on n'a rien à faire on pourraavoir trois développeurs différents qui utilisent la même IA et qui aboutiraientsur des scripts totalement différents donc ce qu'il est bien important de faire c'estde commencer par préparer le terrain donc ne pas partir avec une simple idée mais déjà
00:05:19 :avoir une idée des bibliothèques, des technologies et d'autres choses de ce style que vous allezutiliser parce que ça va cadrer votre projet et vous n'allez pas vous laisser guider parce que l'IA veut mais vous allez plutôt guider l'IA en fonction de ce que vous voulez donctrès important de commencer par ça.
00:05:34 :On va également à chaque fois qu'on va écrire un prompt réfléchir avant de prompterc'est à dire que le mieux c'est de savoir avant de faire le prompt comment vous aborderiezle problème pour ensuite pouvoir comparer avec ce que l'IA va faire si vous ne faitespas ça en fait vous risquez là encore d'être dépendant de l'IA et d'accepter sa solution
00:05:51 :comme la solution qui va permettre de résoudre un problème moi à chaque fois que je vaisfaire un prompt en fait vous allez voir que je vais être assez précis dans ce que jedemande et que je vais être assez critique aussi et c'est le dernier point de ce que
00:06:03 :l'IA m'a renvoyé donc il faut toujours relire le code que l'IA vous a écrit vous allezvoir que là encore quand on précise pas suffisamment les choses elle prend des libertéselle va écrire le code d'une certaine façon donc bien important de faire ces trois pointsde savoir déjà comment vous envisagez de résoudre le problème et une fois que le
00:06:20 :problème est résolu d'avoir encore une fois ce regard critique pour garder un code quiva être propre à vous même si ce n'est pas vous qui écrivez chaque ligne de codeil faut en fait que ce code finisse par vous ressembler comme si c'est vous qui l'aviezécrit et pour finir on va donc parler de la planification du projet donc ce projet
00:06:36 :va être en plusieurs étapes donc avant de me lancer dans ce script je sais déjà queje vais utiliser des bibliothèques Python comme Request, Playwright et BeautifulSoupvous allez voir assez rapidement qu'on n'aura pas besoin dans ce cas ci de Playwright etde BeautifulSoup mais là encore l'idée est de savoir qu'on a des outils à notre disposition
00:06:51 :et qu'on va pouvoir les donner à l'IA si besoin et de ne pas laisser là encore une fois l'IAutiliser des outils qui pourraient par exemple ne pas être les meilleurs outils ou les outilsles plus à jour donc là encore bien important de savoir déjà qu'est ce que vous allez
00:07:03 :potentiellement utiliser dans votre projet. La deuxième chose qu'on va faire c'est donc defiltrer et de sauvegarder les données, la programmation comme toujours c'est récupérer,traiter et afficher des données, c'est que de la gestion de données d'une façon ou d'une autredonc dans ce cas ci on va avoir pas mal de données en entrée, il va falloir les filtrer, les
00:07:20 :sauvegarder pour ensuite pouvoir les afficher dans un autre format dans ce cas ci ce sera dans ladeuxième partie avec la création du site web. La troisième chose qu'on va faire c'est donc
00:07:28 :comme on l'a déjà dit le scrapping éthique donc l'espacement des requêtes, la modification duuser agent et les données publiques donc tout ça on va le faire tout au long du code et ladernière chose très importante ça va être dans une deuxième partie de cette vidéo c'est le
00:07:41 :refactoring donc vous allez voir que dans la première partie on va laisser l'IA avec uncertain degré de liberté, elle va nous faire une première version du code qui va fonctionner quiva nous permettre d'assez rapidement arriver à une version 1 et dans la deuxième partie on varemodeler tout ça là encore en planifiant en préparant avec des idées de comment on veut que
00:00:15
Effectuer un scraping éthique
00:02:40
Stack technique
00:04:56
Quel rôle pour l'IA
00:06:33
Planification du projet
Ce n'est pas fini...
✋
Tu as complété % du parcours 🔥
Termine l'intégralité de la formation pour pouvoir débloquer ton attestation de réussite.