Session du 14 mai 2024 à 20h30
Pratique & Live Coding
Data Science & IA
L'IA dans le domaine de l'apprentissage automatique
Présentation de l'IA dans le domaine de l'apprentissage automatique :
-
Apprentissage supervisé / non supervisé
-
Classification / Régression
-
Live coding sur un projet en Image Processing
Voici les différents documents partagés durant la session :
00:00:00 :Bonsoir à toutes et à tous, donc merci d'être venu pour cet événement que j'avais demandé à Buck Dany de faire,donc sur faire une introduction au machine learning, d'accord ?
00:00:18 :Donc pour ceux que ça intéresse, je suis, je m'appelle Marie Storch, je suis étudiant du coup en Master 1 en Intelligence Artificielle sur Marseilleet j'étudie du coup les différentes technologies en IA, donc que ce soit les apprentissages automatiques, l'apprentissage profond,et d'autres systèmes, les systèmes experts, etc.
00:00:42 :Voilà, donc là aujourd'hui ce qu'on va faire, c'est qu'on va commencer par, ouf, pas de bruit,par faire une petite introduction, voilà, pour parler un petit peu de qu'est-ce que c'est que ce modèle machine learning,parce que c'est vrai que c'est un domaine qu'on a, qu'on entend parler un peu partout dans différents domaines,
00:01:03 :il y a des journalistes qui parlent souvent d'IA sans savoir ce que c'est, il y a plein de, il y a beaucoup de programmeurs maintenant qui,qui, on entend parler de ça, donc voilà, on va faire un petit peu la correspondance avec les maths et l'info.
00:01:31 :On va voir ensuite les différents types d'apprentissage, j'ai oublié le S, qu'on peut faire avec le machine learning,donc on va voir qu'il en existe, il y en a trois qui sont les plus connus.
00:01:44 :Les domaines d'application, qu'est-ce qu'on peut faire avec le machine learning, est-ce qu'on a des limites,quels sont les différents domaines et surtout, qu'est-ce qu'on va pouvoir prédire, etc.
00:01:56 :Je vais faire ensuite un exemple avec le principe de base, où là on va rentrer un petit peu plus dans le détail, d'accord.Dans le détail, ensuite je vais poursuivre avec les algorithmes, d'accord, je vais en présenter deux,qui sont les plus connus du machine learning, qui ont été utilisés de nombreuses fois,
00:02:16 :et qu'on se sert encore quand on a une quantité de données très petite.Et puis on terminera par une petite conclusion.Alors, aujourd'hui, on va parler de machine learning, c'est un sous-domaine de l'intelligence artificielle.
00:02:37 :L'intelligence artificielle, du coup, c'est un terme qui a été créé dans les années 50,avec une conférence qui a eu lieu, je suppose, c'était une conférence de recherche,et en fait il y a la communauté scientifique qui a mis en avant ce terme, intelligence,et ils ont commencé à se pencher sur les fameuses questions, est-ce que la machine peut penser, d'accord.
00:03:03 :Donc on avait de nombreux scientifiques. Fin des années 45, début des années 50,on avait le fameux Alan Turing, qui a en fait mis en place un test,pour vérifier si une machine peut être comparable à un humain,est-ce que nous, donc humains, on peut...
00:03:25 :Alors le test en question, c'est de placer une personne dans une pièce et une machine dans une autre,les deux peuvent communiquer que par le biais d'un ordinateur, donc une interface, une IHM,et est-ce qu'au bout d'un certain delta t, on peut savoir,enfin est-ce que la personne peut savoir si c'est une machine qui est en train de parler ou si c'est un humain, d'accord.
00:03:58 :C'était une IA créée par des psychologues américains, et en fait le test, on l'a mangé.Maintenant on arrive à se dire, on commence à se demander si, à comparer vraiment ce domaine-là à l'humain.
00:04:21 :Et pas se dire, bon, là on parle de machine learning, mais on n'en est pas à des machines à tuer.Juste une chose aussi, dans une autre présentation je parlerai peut-être du deep learning, d'accord.
00:04:35 :C'est un des domaines du machine learning, d'accord, c'est un sous-domaine.Donc là vous avez vraiment les trois ensembles qui vous présentent vraiment le vœu du sujet, ok.
00:04:49 :Alors, un domaine d'émergence de liens.Alors, aujourd'hui, et même depuis qu'on connaît l'informatique, nous on sait faire, on a des règles, on a des données, et on fait des réponses, d'accord.
00:05:06 :Ça on connaît, c'est la programmation dite classique, d'accord.Donc la plupart des programmeurs, ceux qui font du web, ceux qui font du dev, etc., c'est toujours pareil.
00:05:16 :On apprend des règles de grammaire, si on peut dire, des règles par rapport aux différents langages, que ce soit Python, Java, le C++, etc.On a des données, d'accord.
00:05:34 :Du coup, qu'est-ce que je fais ? Je fais une application, j'ai une API, et ensuite je réponds à la demande du client, d'accord.Bon, bon, l'apprentissage automatique, ça ne marche pas comme ça.
00:05:43 :Ça marche, en fait, dans le sens où on a des données en entrée, d'accord.On peut en avoir beaucoup, comme pas beaucoup, d'accord.On a la réponse à ces données-là.
00:05:54 :Et nous, ce qu'on aimerait construire, c'est des règles, d'accord.Et on aimerait faire apprendre à un système à reconnaître, à capter ces règles, pour ensuite le pouvoir le lâcher un peu dans la nature,et qu'à partir des données qu'il a apprises, qu'il puisse reconnaître les réponses qui sont associées, d'accord.
00:06:30 :Bon, mais en entrée, je vais mettre des images d'océan, d'accord.Des images avec océan et sans océan, ok.Je vais lui donner un dataset de, je ne sais pas, 400 images, ok.
00:06:42 :Je vais dire, ben ça c'est un océan, ça c'en est pas un, ça c'en est un, ça c'en est pas un, d'accord.Je fais un peu ce qu'on appelle faire une labellisation, un étiquetage.
00:06:50 :Et ensuite, du coup, je vais entraîner un algorithme qui va pouvoir faire une sorte de classification.Et en fait, en fin de compte, l'algorithme va apprendre lui-même à créer ses propres règles, d'accord, pour savoir si cette image-là contient un océan ou pas, d'accord.
00:07:06 :Nous, comment ferait l'humain si on verrait une image d'un océan ?Ben, on se dit, ben voilà, c'est bleu, ça ressemble à de l'eau, c'est un espace vaste.
00:07:14 :Bon, ben, bim, bam, boum, c'est un océan.Et on arrive facilement à faire le rapprochement parce qu'on a de l'expérience.Depuis qu'on est gamins, qu'on nous a montré, pour ceux qui ont vu la mer, etc.,
00:07:25 :on l'a vu plusieurs fois sous différents angles, dans différents pays, dans différents...On l'a vu plusieurs fois grâce à nos yeux, grâce à un de nos sens qui sont les yeux.
00:07:36 :Notre cerveau, du coup, a assimilé que ce qu'il voyait, c'était l'océan, d'accord.Ça, c'est le côté apprentissage, d'accord.C'est quelqu'un qui nous l'a dit parce qu'on l'a vu marquer quelque part, voilà.
00:07:52 :Et ensuite, du coup, on s'est dit, ben voilà, s'il y a de l'eau, alors c'est l'océan, d'accord.La machine, en fait, elle fait un peu pareil, sauf qu'elle va construire ses propres règles, d'accord.
00:08:02 :Un exemple, ça peut être le pourcentage de pixels qui sont bleus, par exemple.Du coup, elle va dire, ben voilà, ça, ça va être ma règle pour faire la différence, la classification.
00:08:11 :Parfois, ça ne va pas marcher. Parfois, ça va marcher.Ça sera le boulot du data scientist, ou de l'ingénieur machine learning, si on veut, pour dire le vrai terme,qui va devoir faire en sorte de faire apprendre cet algorithme-là, d'accord.
00:08:30 :Bon, ça, j'y reviendrai plus tard.Alors maintenant, donc là, on a parlé d'un truc qu'on appelle la classification, d'accord.J'ai donné aussi l'exemple d'un humain.
00:08:41 :En fait, on va voir qu'on a différents types d'apprentissage.Donc si je prends, par exemple, je vais souvent faire le lien entre l'humain et la machine,parce que quand on parle d'intelligence artificielle, qu'on compare souvent à un humain, d'accord,je veux vraiment vous montrer qu'il y a quand même une grande différence derrière.
00:08:57 :Donc comment on peut apprendre un humain ?Soit avec les sens, tout simplement, donc le visuel, l'auditif, le verbal, le kinesthétique,la logique, le social, le solitaire ou l'apprentissage naturaliste, d'accord.
00:09:13 :Ça, ce sont tous les apprentissages que j'ai trouvés, que j'ai regroupés, d'accord.J'en ai pas oublié.Donc voilà, tous ces apprentissages-là font qu'on est nous, d'accord,nous avec nos 86 milliards de neurones dans notre cerveau en moyenne,à pouvoir en fait lier tous ces types d'apprentissage et à se dire,
00:09:32 :ben voilà, faire de la reconnaissance, pouvoir faire de la prise de décisionet effectuer les tâches au quotidien qu'on sait faire.Bon, ben la machine, c'est plus ou moins pareil.
00:09:45 :Ça veut dire qu'elle va avoir trois grandes familles,qui sont l'apprentissage donc appelé supervisé, non-supervisé et avec renforcement.Alors, donc, faut pas vous affoler, on va y aller mollo, d'accord,et vous verrez qu'en fait c'est vraiment pas compliqué à comprendre le principe de base.
00:10:04 :Donc je reprends mon idée tout à l'heure quand je vous ai dit que, ben voilà, j'avais la mère, d'accord,je vous ai dit que j'ai une photo de la mère et cette mère-là, du coup, je l'ai reconnue sur une image, d'accord,je l'étiquette en disant ça c'est la mère, d'accord, donc je supervise cet apprentissage, d'accord.
00:10:25 :Donc quand je parle d'apprentissage supervisé, c'est que j'ai donné à la machine l'étiquetage de mes données, d'accord.Je peux faire ce qu'on appelle du non-supervisé, d'accord, c'est un autre type d'apprentissage,qui lui, en fait, je vais lui donner mes données, mais je vais pas lui dire qu'est-ce que c'est.
00:10:45 :Par contre, lui va faire en sorte de retrouver les labels en question.Ça on verra, c'est un petit peu plus compliqué, donc ça on s'en sert pas mal dans du marketing,dans des systèmes de recommandation, dans la visualisation de données, d'accord,sur des données cérébrales, par exemple, on peut s'en servir, notamment faire de l'appareillement.
00:11:06 :Il y a vraiment pas mal de choses, et en fait, la différence capitale entre les deux,c'est que le supervisé, lorsqu'on commence à avoir beaucoup de données,donc là je parle pas de 500 images, mais je parle de 500 teraoctets d'images,là le problème c'est que du coup, il faut quand même trouver un moyen de labelliser.
00:11:26 :C'est-à-dire que là, moi je l'ai fait à la main, les 500 images on peut le faire à la main,on emploie, je sais pas, 10 personnes et ça se fait rapide,sauf que des milliards d'images, ça devient compliqué.
00:11:37 :Le problème c'est qu'il y a des sites comme par exemple AWS,ou des grands dégâts femmes comme Facebook et Google,qui en fait emploient des gens pour labelliser leurs données.
00:11:49 :Et ça, ça a un coût qui est monstrueux.Et le problème c'est qu'il faut du monde, il faut de la diversité,et ça coûte beaucoup trop d'argent et de ressources.
00:12:01 :Que le non-supervisé, j'ai pas besoin de ça.C'est-à-dire que j'ai mes données et je peux faire en sorte de pouvoir apprendre tout seul.Alors les performances sont moins importantes,c'est vrai qu'on trouve des meilleurs systèmes avec du supervisé.
00:12:14 :Le non-supervisé, pas mal de chercheurs maintenant ou d'entreprisesessayent de plus se baser là-dessus,parce qu'au niveau du coût, c'est plus intéressant de partir en non-supervisé.
00:12:28 :Et ensuite, au début des années 2000,il y a eu un apprentissage qui a vu le jour,qu'est l'apprentissage avec renforcement.Là en fait, on va laisser la machine fixer les règles,et en fait on va pas lui dire si oui ou non,la règle qu'elle a prédite c'est bien,
00:12:46 :si c'est la bonne image ou pas,mais on va lui donner un score.Donc en y imaginant, si la machine dittiens ça c'est une image où il y a une voiture,je vais dire à 85%,à 85% c'est une voiture.
00:13:02 :Et je vais lui donner ce qu'on appelle un pourcentage de ressemblance,une probabilité.Et la machine, doucement, va commencer à apprendre par elle-même,donc il y a des algorithmes pour faire ça,et en fait va commencer à se perfectionner,et va pouvoir effectuer la tâcheencore mieux que des apprentissages supervisés ou non supervisés.
00:13:28 :Notamment, ça a fait un bing énorme dans les jeux,on peut citer AlphaGo,qui a vraiment atterrassé des joueurs de Go,mais alors c'était vraiment monstrueux.
00:13:41 :Ou par exemple les jeux d'échecs,alors on avait ce qu'on appelle les systèmes experts,comme Deep Blue quand on battu Kasparov,et après quand on a mis de l'apprentissage avec renforcement,dites-vous qu'elle n'avait même pas besoin de connaître les règles du jeupour battre l'humain, tellement que c'était impressionnant.
00:14:02 :Mais ça, l'apprentissage avec renforcement,on s'en sert pas mal,on va allier avec ça des réseaux de neurones,donc je ne reviendrai pas là-dessus,peut-être la prochaine fois lorsque je ferai un événement sur le Deep Learning,mais là en Machine Learning, on va vraiment rester sur l'apprentissage superviséet le non supervisé.
00:14:22 :Alors ensuite, dans ces deux dernières choses,avant que je passe à autre chose,par rapport au supervisé, vous voyez qu'il y a aussi des sous-ensembles,c'est tout ce qui est régression et classification.
00:14:34 :Donc si je prends du supervisé,la classification, c'est simplement pour classerdes images par exemple,des diagnostics, des données.Donc là je dis,imaginons que j'ai un jeu de données, c'est des chiffres,de 0 à 9,donc j'ai tous les codes postales des Etats-Unis,moi je sais que c'est soit les chiffres de 0 à 9,
00:14:57 :c'est mes labels,et je vais dire à la machine,tiens, prédis-moi, qu'est-ce que ça va être.Donc elle va vous renvoyer une classification.La régression, c'est différent.
00:15:08 :Là, elle ne va pas vous renvoyerquel est le chiffre en question, ou quelle est la donnée,elle va vous renvoyer un score de ressemblance,c'est-à-dire qu'on s'en sert pour lesprédictions météorologiques par exemple,en disant, à 85%,il fera mauvais temps.
00:15:28 :Donc là, la régression, on parle vraiment beaucoup deprédire des valeurs,et pas prédire vraiment les labels en question.Mais je prendrai un exemple et je vous en reparlerai.
00:15:42 :Alors les domaines d'application.Donc ça, c'est quelque chose qu'on pense que c'estvalable que pour des images, du son, etc.Eh bien pas du tout. En fait, le machine learning,
00:15:52 :on s'en sert de partout.C'est un domaine de l'IA qui est vraiment présent,mais vraiment, quand vous êtes ingénieur de donnéeslà-dedans, en machine learning, vous pouvez faire de tout.
00:16:04 :Il suffit de connaître les éléments de base,alors il suffit de, je relativise,et vous pouvez vraiment,ça peut partir de la reconnaissance vocale et image,au diagnostic médical,donc détection des cellules cancéreuses,filtrage des spams sur le web,ça peut être aussi un filtrage, par exemple, des messages
00:16:24 :frauduleux, lorsque vous avez, je ne sais pas, des spamsou quoi, qui vous rentrent dans les mails, ça vous filtresi c'est un spam ou pas, du coup.
00:16:33 :Recommandations de contenu, voilà, les systèmescomme Amazon, etc. de basese servent du machine learning, d'accord,se servent toujours, mais avec des architectures différentes.Détection de fraudes, on l'a dit,traduction, après,traduction, tout ce qui est code traduction, etc.
00:16:51 :se servent du machine learning,donc des réseaux de neurones,du deep learning.Prédiction universe, ça on a dit,que ce soit prédire la météo,prédire, je ne sais pas, moi,est-ce que,si j'ai une classe de 25 élèves,quelles seraient les prédictionsque dans X égale, je ne sais pas,
00:17:11 :plusieurs années,quel sera évidemment le score moyen, etc.Les assistants personnels virtuels,donc là on peut citer Alexa, de chez Amazon,qui a vraiment fait un boom aussipour ses assistances à la maison.
00:17:25 :Donc on a aussi l'IA qui est présente chez nous, d'accord.Il faut savoir qu'en fait,pour développer un système de machine learning,il ne faut pas une machine puissantequi puisse faire, je ne sais pas,il ne faut pas des data centers, d'accord.
00:17:38 :Sur un desktop classique,on peut faire du machine learning.Il suffit simplement de faire,si on n'a pas beaucoup de données,par exemple, je ne sais pas,si je fais la classification d'images,je n'ai pas besoin d'avoir un téraoctet d'imagespour faire la classification binaire, par exemple.
00:17:54 :Donc vraiment, c'est à la portée de tous.Par contre, il suffit de faire les maths, d'accord.Et ça, les maths,c'est ce qu'on va voir maintenantpar rapport aux principes de base.
00:18:04 :Donc tout à l'heure, j'ai pris le cas des,j'ai pris le cas des, comment ça s'appelle,des photos de mer, etc.Là, je vais prendre le cas, en fait,de photos d'Iris, d'accord.
00:18:14 :Donc c'est un jeu de données,un dataset qui est présentdans une librairie de machine learningqui s'appelle Escalerm, qui est vraiment très connuparce que, pour ces algos qui sont déjà optimisés,mais aux petits oignons.
00:18:26 :Donc là, si je vous montre, par exemple,trois Iris différents, donc là, je vais rentrervraiment dans le principe mathématique, d'accord.Alors je vais le faire ultra simple,parce que je sais qu'il y en a qui n'aiment pas les mathset qui vraiment vont avoir envie de me bloquer
00:18:38 :après que j'aurai fait cette présentation,si je commence à leur parler des centres de gradients et tout.Donc je vais rester calme, d'accord.Au niveau de la présentation.
00:18:46 :Donc si je prends trois Iris,donc les Cetos,les Versicolor et les Virginica,d'accord, et en fait,moi ce que j'aimerais faire, c'est que la machine puissereconnaître une des troistypes d'Iris, d'accord,en fonction de deux paramètres,le pétale et le sépale,d'accord.
00:19:06 :Donc, imaginons,je prendsun graphe, à droite,et je vais placeren fonction des tailles des pétales et des sépales,d'accord, donc les pétales en abscisseset les sépales en ordonnées,qui sont les principales componentes,vous avez compris.
00:19:24 :Les différentes dimensions,je vais me rendre compte qu'au final, je vais avoir un peu des groupesqui vont se dessiner, c'est-à-dire queles Cetosa, en fait,ceux que j'ai mis en rouge, sont plus au milieu,donc ils ont un pétaleun peu compris entre moins un et deuxet un sépale entre moins un et un.
00:19:40 :Les Virginica, c'est l'inverse,ils vont avoir un pétale un peu plus grand,donc entre deux et quatre,et par contre les Cetos,entre moins trois et moins deux.
00:19:50 :En fait, ce qu'il se passe, c'est que là,de manière intuitive,on se dit, mais attends, c'est super,là j'ai trois groupes différents,si j'arriveà trouver un moyen de pouvoir,je sais pas, j'arriveavec un pétalequi mesure, je sais pas moi, un centimètre,alors là, c'est des valeurs négatives,
00:20:10 :faut pas regarder ça, maisj'avais des distances positives, d'accord,j'ai pris un exemple,si j'ai un pétale, je sais pas,entre zéro et deux centimètres,et avec un sépale entrezéro, cinq et un,par exemple,j'ai de fortes chances d'être dans la partie rougeou à mi-cheminavec la partie bleue.
00:20:32 :Et donc en fait, ce que je vais vouloir faire,c'est simplement faire des regroupements,d'accord,et on va voir ça avec les différences d'algorithme.Donc,pour continuer avec la partie d'avant,à gauche, vous avez une imaged'un algorithme qui s'appelleles k-nearest neighbors,qui est l'algorithme des quatre proches voisins,
00:20:52 :où en fait, je vais avoir trois classes,donc en fait, les classes correspondentau type de pétale, au type de diris,donc les cétoses, les versicolores et les virginicas,et en fait,moi je vais arriver avec mon point pété,et je vais dire, ok,moi j'arrive au milieu, de quel ensemble
00:21:08 :je suis le plus proche ?Est-ce que je suis le plus proche de l'ensemble vert,de l'ensemble bleu,ou de l'ensemble rouge ?Et je vais, en fait, mettre au point,je vais calculer les distancesentre, par exemple,je ne sais pas, je vais prendrequatre voisins, d'accord,dans un rayon de, je ne sais pas, de deux centimètres,
00:21:28 :je vais récupérer quatre voisins,et je vais faire la moyenne, et si j'ai plus de bleus que de rouges que de verts,donc j'ai deux bleus, un rouge et un vert,eh bien j'ai plus de chances d'être dans les bleusque dans les rouges que dans les verts.
00:21:38 :Eh bien vous venez de faire votre premier algorithme de classification,avec distance euclidienne, voilà.Alors, c'est vraiment très très con,mais cet algorithme-là, il fonctionnedu feu de Dieu, d'accord ?
00:21:48 :Ok.Donc là maintenant je vous ai montré un exemple de classification,mais maintenantsi je reprends l'exemple précédent,mon but en fait,eh bien ça va pas être de prédire des,comment ça s'appelle, des classes,mais ça va être de prédire si c'estou pas un iris,d'accord ? Donc je vais prendre la taille,
00:22:08 :je vais prendre deux caractéristiques, d'accord ?Donc là j'ai pris le pétale stépale, mais imaginonsbah j'ai des pétales et des stépalessur d'autres fleurs, ok ?
00:22:16 :Je vais calculer les distances,donc sur le graphiquede droite, je vais le mettre,et je regarde un petit peuce que ça va donner.
00:22:26 :Eh bien je me rends compte qu'en fait, si je commenceà mettre tous les,mais comment ça s'appelle,enseigner toutes les différentesdonnéesde mon entraînement,donc de mes training points,mes points d'entraînement, donc c'est mondataset, je me rends compte qu'en faittous ces points là,eh bien tant bien qu'on pourrait tracer
00:22:48 :une sorte de courbe, d'accord, qui peutun peu, bah passerplus ou moins par rapport à tous ces points là,d'accord ? Eh bien cette courbe là,
00:22:56 :en fait, on pourrait la suivre comme une courbede prédiction, ça veut dire que si j'ai un pointqui est, je crois une nouvelle plante,d'accord, que je la mets au milieu,donc un test, d'accord,je vais voir un peu la distanceavec ma courbe rouge, etsi c'est proche, eh bien il n'y a pas mal de
00:23:12 :chances pour que ça soit, bah,comment ça s'appelle,un iris, d'accord ?Un iris, un iris, je ne sais plus.Par contre si c'est très éloigné, bah là, dans ce cas là,je ne suis pas du tout sûrd'avoir ça. Et là on voit
00:23:26 :un petit peu le principe de récréation,donc là on n'a pas des classes,on a juste tous nos points, d'accord, et onaimerait de relier tous nos points. Alors,
00:23:34 :dans le plus beau des mondes,ça marche comme ça. On aune jolie courbe, ok, eton aimerait tous les relier. Dans lepire des cas, c'est qu'en fait on n'est pas endeux dimensions, d'accord, donc on n'a pas simplementdeux caractéristiques,mais on en a, par exemple, je ne sais pas,
00:23:50 :une cinquantaine. Et là on est endimension cinquante.Attention, je vais faire peur un petit peu à ceux qui font de laphysique, je sais. Dimension
00:23:58 :cinquante, ça veut dire qu'un pointpeut être représenté sous cinquante dimensions,parce qu'il a cinquante caractéristiques,d'accord. Dans ce cas-là,on va opterpour des algorithmesun peu pluspuissants, d'accord. Là à gauche,
00:24:14 :vous avez les KLN, à droite c'est la récréationpolynomiale, sa forme polynome.On va avoir des algorithmes commeles supports vecteur machine, leboosting, je n'en parlerai pas aujourd'hui parce queje voulais vraiment rester simple,d'accord, qui vont pouvoir en faitfaire ce genre de choses, d'accord.
00:24:30 :Donc là vous avez vraiment vu le principe de basedu machine learning, donc j'ai despoints, j'ai un jeu de données,je l'affiche quelque partpour me donner un nuage de points, si je veux fairede la régulation, ou je l'affiche les points icisi je veux faire de la classification,
00:24:44 :et j'analyse. Donc vous voyez qu'il y avraiment un travail d'analyse qui se porte avantde pouvoir faire des prédictions. Doncil y a des maths, bien évidemment, là j'ai pasmis d'équations pour encore une fois ne pas fairepeur aux gens, mais il y a une partiemathématique qui est assez importante
00:24:58 :et qu'il ne faut pas négliger, d'accord.Doncvoilà, là vous avez vraiment vules algos de base, donc j'essaie de faire simple.Donc pour reprendre un petitpeu ce qu'on a dit, déjà de un,faites du machine learning et jetez vos ordis Linux et Chromebook,je vous en supplie.
00:25:14 :Deuxièmement, il y a une réellerévolution dans le monde de l'IA, parce queon a réussi à accomplir des tâchesqui étaient pour l'humainsoit difficiles,soit qui étaientchiantes à effectuer, d'accord.
00:25:28 :Maintenant, toute l'industrie,une grande partie de l'industriemarcheavec des algorithmes de machine learning,voire de deep learning, d'accord.Donc une réelle révolution,parce qu'on a vu avecmaintenant, on a des IA qui génèrentdu texte, d'accord, commechatGPT, qui génèrent des imagescomme mid-journée ou copilot, etc.
00:25:50 :Là, hier, il y aGPT 4.0 qui est sorti,donc c'est une nouvelle IA sortie par OpenAIqui permet de parleravec un humain comme une conversation classique,donc c'est bluffant.
00:26:02 :On a doncdu coup, comme je dis, une ouverture vers le deep learning,qui est encore un sous-domainequi vraiment marche. Alors lui,en fait, il ne se sert pas à de l'algorithmecomme Cayenne, etc. Mais lui,
00:26:14 :il va se baser vraiment sur le fonctionnement des réseauxhumains, d'accord.Il y a un algorithme, le Perceptron,qui a été amélioré par la suite,sorti en 1957, etqui a vraiment...
00:26:26 :Là, on est vraiment rentré dans un truc où on essayede reproduire le comportementhumain, pas seulement sur lestypes d'apprentissage que fait l'homme,mais vraiment surcomment il fonctionne au niveau cérébral,pour vraiment l'appliquer dans une machine.
00:26:40 :Et ça, c'est puissant.Donc, prédictions à faire dans le systèmeinformatique à l'heure machine learning.Alors, ça, c'est pour savoir un peuquand est-ce qu'on doit se servir du machine learning ou pas,si on a des prédictions à faire,ou qu'on veut utiliserdes algorithmes,en fait, pournous remplacer ou pour faire des tâches
00:27:02 :qui pourront nous servir. Par exemple,pour vous donner unautre idée, je vais faire une prédictionsur, je ne sais pas,pour caractériser les différentesbaleines en mer Méditerranée,les différents dauphins, par rapport auxdifférentes zones cartographiques, je vais mecharger du machine learning, ouje veux détecter, comme je dis, les cellules
00:27:22 :cancéreuses, il y a des recherches qui se font en cemoment, où des machines, en fait,arrivent à détecter le cancer, alors quedes humains n'arrivent pas à le nu.
00:27:30 :Donc, c'est qu'on arrive à faire des chosesoù il faut voir la machine comme quelqu'unqui va nous aider, qui va nous épauler,et qui va vraimentêtre làpour remplacer certainsde nos tâches. Alors, quand je dis
00:27:44 :remplacer, c'est avec de grands guillemets,parce que tout le monde dit, oui, mais l'IA, du coup,ça va, d'un point de vue éthique,ça va remplacer des métiers,tout automatisé, c'est pas bien non plus.
00:27:54 :Oui, c'est vrai que, du coup,il y a des emplois qui vont disparaître avec l'IA,j'en suis tout à fait d'accord,mais ça va créer des emplois aussi,des métiers qu'on ne connaît pas encore forcément,d'accord, pas seulement des métiersde développeurs, mais ça va créer des métiersqui sont par rapport à eux, d'accord.
00:28:10 :Tout n'est pas que prédiction,attention, parce queil faut modéliser le fait quemachine learning à tout va, d'accord,donc là vous parlez àun étudiant qui fait du master,donc moi j'en vois partout, maisil faut pas en mettre partout des chosesqu'on peut pas prédire, tout simplement,
00:28:28 :d'accord, des choses qu'on ne sait pas faire,peut-être pas, peut-être jamais,ou peut-être pas encore, d'accord.Par exemple, si je prévois la prochainecatastrophe naturelle,ça des fois,même on peut avoir les meilleurs systèmes,les meilleurs géographes, etc.,
00:28:44 :les meilleures données de système,on n'y arrivera pas forcément,parce que mère nature, elle fonctionnecomme elle veut, et la machine,elle s'en tape à rien, si vous me permettez.
00:28:54 :Voilà, donc du coup, j'espère que cetteprésentation vous aura plu,je vous remercie d'y avoir assisté,et je suis là maintenant pour répondreà toutes vos questions.
00:29:04 :...Euh, ouais, euh...Tu conseillesquels cours ?C'est-à-dire ? Quels cours ?Pour apprendre, ouais....Alors, en fait,les cours,il y a pas mal de cours en informatiquesur unyoutubeur qui s'appelle Machine Larnia,donc il fait pas mal de cours là-dessus,sans lui faire de la pub, c'est juste que
00:29:36 :c'est écrit comme ça.Après, si tu veux, le Machine Learning,il y a des sites commeKaggle, où en fait, ils proposentd'expliquer de A à Zcomment ça fonctionne, d'accord ?
00:29:48 :Donc, de manière générale, je ne l'ai pas dit,mais c'est avec le langage Python,d'accord ? Parce qu'il y a le plus de librairies,et c'est le plus facile à gérer.
00:29:56 :J'ai dit Python à quelques parties.Donc, du coup,ça peut pas vous faire fuir, quand même.Donc c'est le langage le plus simple.J'ai des références au niveau des bouquins,si tu veux, après la présentation, je pourraist'en donner, si ça t'intéresse.
00:30:10 :Et de plus,avec Bug Danny, j'ai allé voir pour faireun salon pourdonner des sujets, pour ceuxqui s'intéressent. Donc au début,guidez, et après je vous passe un dataset,et vous vous démerdez. Je vous donne une directive en disant
00:30:24 :je veux prédire,je sais pas,à partir des images, est-ce que je peux détecterun objet ? D'accord ?Bon après, ça sera le TP10 000, tu vois, mais c'est pour donner des exemples.
00:30:36 :Il y en a plein desdonnées, ça peut être,je sais pas, à partir d'une image,quelle est l'espèce d'oiseauqui a été repéré ?
00:30:46 :Tu vois ?Après, comme je l'ai dit là-dessus,j'ai montré pas mal d'exemples avec les photos,ça peut être des exemples aussides jeux de données comme Titanic.
00:30:56 :Titanic, c'est un jeu de données qui est assezconnu, notamment parce qu'on aen fait, alorsc'est glauque que je veux dire,mais à partir de tonsexe, de ton poidset d'autres données,on peut prédire, si ou pas,tu aurais survécu à l'autre âge du Titanic.
00:31:14 :Alors vraiment, je vous ment pas,ça marche, on l'a fait en cours.Et c'est vraiment, c'est impressionnant,ça cloue surle bec, doncvoilà, si jamais ça t'intéresse...
00:31:26 :Ça a pas besoin de faire de l'intelligenceartificielle pour ça ?Ah bah c'est du machine learning.C'est du machine learning. C'est-à-direqu'en fait, on a des données, on acent-cinq, enfin, pas cent-cinquantemille, il y a combien ? Mille et quelques
00:31:40 :mille-trois cents, il y en avait, je crois.Il y a peut-être mille-trois cents de données, où on avaitles passagers, on avait leurâge, etc. Et en fait,
00:31:48 :on a trouvé une certaine courbequi pouvait rapprochertous les passagers, donc si on prendle cas qu'un passager soit un pont,d'accord, avec ses différentes caractéristiques,bah en fait,par rapport à ça, trouver une certaine régularisationet en fait prédiregrâce à cette technologiesi ça marche pas.
00:32:08 :Voilà.Ok.Est-ce que vous avez d'autres questions, par hasard ?Dans le bouclier...Attends, mais...Alors, je vois pas levocal textuel.Alors,qu'est-ce qui se dit ?
00:32:36 :Hop.Ok, je peux pas voir le...À l'échelle individuelle,où peut-on faire ? Quel type de projet,Morphée ? Je connais juste de t'aimer, et les fameux
00:32:50 :enfants de Morphée.En fait, pour le présenter rapidement,ce qu'on peut fairedirectement, je vais vous montrer.Donc là, vous avez Machinernia,qui est une bonne référencepour tout ça, donc il a faitdes formations entières où en fait,il vous présente un peu le langage Python,d'accord, parce qu'il y a, comme je dis,
00:33:10 :il y a pas mal de...il y a pas mal de, comment ça s'appelle,de librairies à connaître,notamment Mempy,pour la manipulation des matrices,connaître les bases, donc les tubes,les decodes, etc., savoir manier
00:33:24 :le...le langage de base,si on peut pas faire de l'IA, si le Python,vous savez pas le manier, ça va être compliqué, quoi.Après, il vous parle des différentesmétriques, donc comment calculerles fonctionsd'erreur, etc., donc
00:33:40 :moi je propose lui, parce qu'il est vraiment bien, pour le coup.Après, vous avez des sites commeKaggle.Là, en fait, Kaggle, de base, c'est un site qui proposaitdes compétitions de machine learning,et en fait, dessus, il y a...
00:33:52 :vous avez toutes sortesde discussions, à l'inverse, si je prends...bah là, si je prends Kaggle...Comment ?Je peux envoyer le lien, s'il te plaît ?
00:34:02 :Ouais, ok, ouais, les deux.Ok.Donc, Kaggle, bah, Kaggle, c'est un site,donc du coup, là, si je prends leKaggle Classifier Tutorial,donc là, en fait, c'est sous forme deJupyter Notebook, où on fait une présentationde l'algorithme, d'accord,et en fait, on monte pas à pas, du coup,
00:34:22 :on importe le dataset,on l'analyse, d'accord,avec les différents...bah voilà, si c'est unlentier, si c'est une chaîne de caractère,etc., et ensuite, au fur et à mesure,
00:34:34 :on va vous fairedes analyses au niveau des cours,des matricesde confusion, enfin ça, c'est un peu compliqué,mais voilà, vous allez voir un petit peudans les différents domaines. Ça, je pense,
00:34:46 :c'est un bon truc pour commencer, je veux aussi le mettre.Après,le plus important, ça serait vraimentde pouvoir en parler, d'accord,si vous avez des questions, notammentdans le serveur ou quoi,en e-mail ou je sais pas si il y en aou pas, vous pouvez faire un...
00:35:02 :poser une question en Machine Learninget moi, ça serait une joie d'y répondre,hein, je suis là pouraider, parce que c'est vrai qu'il y apas beaucoup de... ça se démocratise
00:35:12 :pas encore beaucoup au niveau des devs,je ne vois pas... il n'y a pas beaucoupde personnes qui sont vraiment intéressées par çaet tout, pour le moment, maisc'est un domainequi est en plein essor, c'est-à-dire quequand vous commencez vraiment à toucherdu doigt qu'est-ce que c'est, bah là, vous
00:35:28 :vous rendrez vraiment compte qu'il y a des trucs...c'est bluffant, quoi, c'est bluffant.Voilà.Est-ce que vous avez d'autres questions ?Non ?J'ai perdu tout le monde ?
00:35:46 :J'ai pas parlé beaucoup de maths, en plus, hein.Et toi, t'en es arrivé comment,en...en...affaire de l'IA ?Alors moi, j'ai faitune licence informatique.
00:36:04 :Au début, j'ai... alors j'ai fait uneL1, c'était un trou commun, d'accord,donc je commençais par des maths, de la physique, de la photo,et tout. Les maths, la physique,
00:36:12 :la méca, ça me faisait chier, clairement, je l'avoue.L'info, ça m'a plu.On m'a amoureux. Je suis partide là-dedans, et en fait, moi, je voulais pasfaire geek, parce que clairement, rester sur mon PC,ça allait me gonfler ou faire des rêves, etc.
00:36:24 :Et j'ai vu qu'en fait, l'IA,ça regroupait pas mal de maths,et moi, j'aimais bien les maths. Et en fait, ce qui est bien,c'est que c'est un domaine qui touched'autres domaines. Alors moi, ce qui me plaisait aussi,
00:36:34 :c'était la neurosciences, d'accord, je suis toujoursété intéressé par le fonctionnement d'un cerveau,etc., et voir comment ça fonctionne,parce que, bah,sans le fonctionnement d'un...
00:36:44 :sans savoir le fonctionnementd'un cerveau, on n'aurait jamaispu faire du deep learning, par exemple.Donc, il y a vraiment un lien, et je me dis, bah,pour améliorer ça, il faut connaître...
00:36:54 :il faut se connaître nous.Et du coup, j'ai continué...Donc, je suis rentré en masteren septembre dernier, et là, actuellement,je suis en stage où, en fait, je suis à la fois dans unlaboratoire de recherche CRS,qui traite,en fait, des cortexs humains,faire des apparignages de gras pour
00:37:12 :trouver, en fait, dessimilitudes entre les personnes,d'accord, ou des anomalies,si une personne a un handicap,etc., quelle est lasurface du cerveauqui va être touchée ?
00:37:26 :Bah, ça, c'est du deep learning, on fait ça.Donc, on se sert de l'IA pourréfléchir sur d'autres choses.Donc, c'est super. Enfin, moi,ça m'intéresse, ça me passionne.
00:37:36 :Donc, voilà.D'autres questions,peut-être, les autres ?Allô ?Ouais. En fait, je voulaisdemander, est-ce que c'est vraique, par exemple, en Chine,avec les caméras de surveillance,ils utilisent le machine learningpour pouvoir reconnaître chaque personnegrâce à une base de données, par exemple,de leur passeport ou de leur carte d'identité,
00:38:10 :et du coup, ils arrivaient à reconnaîtrechaque crimeou autre chose ? Alors, du coup,ce qui se passe en Chine, j'ai une amie en Chinequi m'a, un ami à moi,qui m'a expliqué, en fait,il y a un système de reconnaissance facialequi est basé sur un algorithme
00:38:26 :de deep learning qu'on appelleles réseaux convolutionnels,et donc, en fait, si tu veux,chaque habitant de Chineest associé à un score social.Et si la personne, en fait,qui est reconnue, par exemple, dans la rue,en train de, je sais pas,marcher sur une routealors que c'était rouge ou quoi,
00:38:46 :en fait, ça va diminuer ton scoreou ça va l'augmenter,si tu fais des bonnes actions.Et, en grosso modo,en fait, si tu veux,si ton score diminue trop,tu vas avoir des problèmes avec la justice, tu vois.
00:39:00 :Donc, ouais, ça existe, ça a été développé.Ils veulent faire ça aussi à Paris,pour les JO.Ça a été pensé notamment pour détecters'il y avait des personnesqui étaient ou pas,voir s'il n'y avait pas vraimentdes terroristes dans la foule.
00:39:16 :Ça a été pensé, je crois,j'ai pas eu de nouvelles,mais j'en parlais à mes directeurs de mon laboratoireet ils m'ont dit qu'il y a eu des chosesqui ont été pensées.
00:39:26 :C'est quelque chose qui est partout, quoi.Donc, oui, c'est plein de rumeurs.Après, que la machine...Ouais, vas-y.Ça arrive que ça fasse des erreurs,et du coup...
00:39:38 :Ouais, en fait, ce qui se passe, c'est que du coup,quand tu vasanalyser les scores de ta machine,en fait, ce qui va se passer,c'est que tu vascalculerce qu'on appelle,alors, les vrais positifs,les vrais négatifs, les faux positifs,les faux négatifs.
00:39:58 :C'est-à-dire, je m'explique. Si je prends le cas,par exemple, tu veuxprédire si une personne a un cancer ou pas.Bah, toi, tu veuxsavoir déjà à quel pourcentageta machine prédit bienquand il y a un cancer.
00:40:12 :Si elle prédit bien, là, il y a un vrai cancer.Par contre, il faut faire attentionde minimiser l'erreurquand, par exemple, je te disque la personne avait un cancer,mais la machine ne l'a pas détecté.
00:40:24 :Alors, du coup, bah, en fait,c'est que t'as loupé une erreur, tu vois.T'as loupé une info.Et du coup, bah, le problème, c'est que parfois, t'as des médecins qui checkent pas.
00:40:32 :Et bah, du coup, la personne qui a un cancer,elle est bien son amie.Donc, ça, il faut faire attention. Alors, c'est un exemple.En pratique, ça...
00:40:40 :Il y a des statistiques qui s'appuientsur le fait de diminuer cette erreurle plus possible.Il y a desformules de probas, il y a des théorèmesqui font que ça... On peut avoir
00:40:52 :des... Comment ça s'appelle ?Des... Comment ça s'appelle ?Des choses pour repousserce problème-là. Après, le but,comme je te dis, c'est de... En fait, si tu veux,
00:41:02 :le but d'un...Enfin, je veux dire, un ingénieur de machineen ligne,c'est une personne qui fait de l'optimisationtous les jours. C'est-à-dire qu'apprendre,en fait, c'est optimiser, en quelque sorte.
00:41:14 :Il y a, d'ailleurs, des recherchesen droit qui se font.Dans la psychologie, est-ce qu'apprendre, ça serait pasdéjà optimiser ? Parce qu'en fait,à chaque fois qu'on apprend quelque chose, on veut toujours faire mieux.
00:41:24 :On veut toujours perfectionner, etc.Une machine, c'est pareil.C'est-à-dire qu'on apprend... Elle apprend à faire un truc,mais elle optimise sa performancepour diminuer son coût.
00:41:34 :Donc c'est quelque chose qui est...Qui est weak. Ça fait partiedu... Ça fait partie du job.En France, la question éthiqueliée à cette reconnaissance doit sûrement reposersur des projets de reconnaissance.
00:41:46 :Je pense.Reposer sur des projets de reconnaissance.Après, il y ala France, c'est la France. C'est-à-dire que ça,c'est ce qu'on dit aux gens. Il y a ce qui se passe.
00:41:56 :Je prends le cas de Cambridge Analytica.Ils ont servi de diplômepour anadouerles gens, les électeurs.J'ai lu un bouquin d'unmec qui s'appelle Yann Lequin, qui en a parlé.
00:42:08 :Ils se sont tapésle coquillard de savoirquelle était la loi. Ils ont balancé.Et voilà. Il y a du financement.Ça rapporte de l'argent.
00:42:18 :Il n'y a aucune trace. C'est comme... Là, il y a un problèmeavec JGPT, avec OpenAI. Ils ont des procèsde partout. Ils ont pris
00:42:24 :en fait pour... Alors, là, on vaparler en big data.Là, je vous ai parlé de 500images. D'accord ? Bon.JGPT, pour le faire apprendreet qu'il soit aussi performant,on a eu une ordre d'idées surla taillede l'apprentissage. Ils ont
00:42:42 :pris, et je ne mens pas,tout Internet.Ils ont pris strictement tout.D'accord ? Tout ce qui était textuel.Et ils lui ont fait bouffer ça dans un réseau de neurones.
00:42:52 :D'accord ? Ça a donné JGPT 3.5.Ils ont fait encore...Ils ont augmenté la tailledes réseaux de neurones. Ça a donné JGPT 4.Et là, il y a bientôt JGPT 5 qui va sortir.
00:43:02 :Donc, c'est pendantune ordre d'idées qu'ils ont des procèsparce que c'est en fait les donnéesqui vont être crédites par la machineà qui elles appartiennent.
00:43:12 :Si je prends par exemple...J'ai plombé le bouquin de...Je ne sais pas moi... Un bouquin de Game of Thrones.Donc l'auteur a porté plein deopinions en disant, mais vous êtes sérieuxde ce que j'écris ? Bah ouais, mais c'était en ligne.
00:43:26 :Donc c'était en ligne, ça appartient à qui au final ?Donc en fait, il y a vraiment un problème d'éthiquesur ça. Donc ça, il faut faire attention.
00:43:32 :Mais en tous les cas, s'ils veulent développer,ils développent. Enfin, il n'y a pas de...En fait, il y a des chercheurs qui sont pour le bien.
00:43:38 :Il y a aussi des chercheurs qui sont aux côtés de la forcepour se le dire, ça existe.Et malheureusement, c'est comme ça.Donc tout dépend des populations.
00:43:46 :Je dirais.Alors...Donc, il faudrait être quel en mathspour faire du machine learning ?Pas forcément. Non, non, pas forcément.Moi, je n'étais pas une date en maths.
00:43:58 :Au début.C'est juste qu'il faut savoir leschoses de base. Si je te parled'une matrice, il faut que tu apprennesà savoir ce que c'est. D'accord ?
00:44:08 :Si je te parle d'un vecteur, si je te parledu symbole somme, etc.Voilà. Pour te donnerun nombre d'idées. Alors, si je prendspar exemple...
00:44:18 :Euh...Comment s'appelle cette formule ?Attends. Je vais vous donnerun exemple concret.Euh...Tac, tac, tac.Quelle année ?En fait, à la base,il y a les codes qui sont déjà faits.
00:44:36 :Il y a aussi les pseudo-codes. D'accord ?Grosso modo, ça, c'est l'algorithmeen fait.Celui-là, il n'est pas bon.Quoi ?Voilà. Ça, c'est le cadeau
00:44:48 :des cameras tables que j'ai présenté tout à l'heure.Là, en fait, tu vois queau début, tu as la partie classifier.Tu as tonespace d'entraînement, tes tests et tes labels.
00:44:58 :For i, tu fais une boucleet tu calcules des distances euclidiennes.Bon, il faut que tu te rappelles quedans euclidienne, c'est racine carrée, 2xb moins xa plusyb moins yk, ou carré, machin chose.
00:45:10 :Bon. Après, comme je te dis,il y a des algorithmes qui sont simples.Et après, on peut faire mes autres, je montre crescendo.Donc les maths, il ne faut pas en avoir peur. Parce que déjà,
00:45:18 :génial, mes amis,que informatique, l'étymologie, ça veut diremathématiques et informations.Donc en fait, vous faites déjà des maths. Ça me laisse savoir.Donc non, il ne faut pas avoir desconnaissances de faux maths. Ne vous inquiétez pas.
00:45:30 :Je te le reparlerai plus tard.Mais ce n'est pasune obligation.Tu aurais des sources de l'IA pour l'IApar renforcement ? Je pense notamment aux jeux
00:45:40 :vidéos.Alors du coup, pour l'IA par renforcement,alorsmoi, je n'ai jamais fait d'IA par renforcement.D'accord ? Je connais juste l'algoque j'ai étudié il n'y a pas longtemps.
00:45:52 :Je l'ai regardé quelque part.Après, un algo que tu peux essayer de faire,c'était, alors il y avait unyoutubeur, je crois qu'il avait faitdes vidéos parapprentissage par renforcement.
00:46:04 :C'était sur...Je ne sais plus.C'était un espèce de labyrinthe, je crois.Pour apprendre au début.Je crois que c'est lui.C'est Tibone.Ouais.C'est sympa.
00:46:20 :Voilà.Le Q-learning, c'était l'algo en question.Voilà.C'est quoi ?Ok.Partage dans le truc si ça t'intéresse.Donc ça, c'est de l'apprentissage par renforcement.
00:46:40 :Il explique bien le fait de...Comment on fait pour donner des coups, etc.Alors, ensuite...Ok, merci.Il faut avoir de bonnes bases,mais tu peux le pratiquer.
00:46:52 :Ok.......C'est quoi l'IA par renforcement, s'il vous plaît ?Alors, comme je disais tout à l'heure, l'IA par renforcement,c'est une...C'est l'apprentissage par renforcement.
00:47:06 :C'est pas l'IA par renforcement.C'est le fait que la machineva apprendre par elle-même.C'est-à-dire que tu ne vas pas lui dire si elle a fait faux,si elle a fait...
00:47:16 :ou si elle a répondu juste.Mais tu vas lui donner un score.Imaginons, je joue à...Je joue avec des enfantsqui doivent faire le plus beau château de sable.
00:47:26 :Je vais pas lui dire si c'est très bien.Mais je vais lui donner un score, genre 4 sur 10.Ou 9 sur 10, tu vois.
00:47:32 :Et au fur et à mesure, tu vas faire apprendre ta machine comme ça.Donc avec l'algorithme de Q-learning.C'est un algorithme très connu.Euh......
00:47:42 :Je sais que j'ai pas bluffé.Je connais pas. Je suis pas assez......C'est chaud ou c'est froid ?Ouais.Voilà. Est-ce que vous avez d'autres questions, peut-être ?
00:47:54 :Tu vas faire des épisodes toutes les semaines,entre guillemets, de machine learning ?Alors ça, c'est ce que m'a demandéBug Danny.Parce qu'il y avait des demandespar rapport à ça.
00:48:10 :Alors pas toutes les semaines, parce que moi je suis en stageet j'ai du travail.Je pourrais pas en faire toutes les semaines.Mais peut-être tous les 2-3 semaines.
00:48:18 :Donc là, la prochaine fois,je crée une présentation du Q-learning.D'accord ?Comme ça, je sais que toutes les vidéossont enregistrées, vont être postées quelque part.
00:48:28 :Donc après, vous pouvez les revoir et tout.Et si jamais ça vous donne un coup de pouce,vous savez de quoi faire.Le prochain, c'est quand ?
00:48:36 :Je sais pas encore pour l'instant.Déjà, j'attendais de faire celui-là.J'attendais de voir le nombre de personnes qu'il y avait.Et puis de toute façon, il y aura de la demande.
00:48:44 :Et puis la réponse à la demande,c'est un peu...Voilà.Et après, peut-être que je ferai un live-coding aussi, pour vous présenter un petit peu.
00:48:52 :Alors, c'était quoi la différence entreprogrammer et un programme...un programme learning ?Attends, c'était quoi ?Entre un programmeur, tu veux dire ?Anous ?
00:49:06 :Oui, il est parti.Ok, il est là.Euh...C'est un sujetqui m'intéresse, mais je l'ai mis de côté.Le deep learning, je sais pas.
00:49:18 :Dragneer ?Ok, ouais, je sais pas.Ok, d'accord.Bah là, le deep learning, en soi,c'est un autre univers.Là, on touche des trucs, c'est...
00:49:36 :Là, j'en prendrai pas soin,je suis fatigué, mais là, en fait,on touche dans les réseaux de neurones,il y a des trucs, c'est...On s'approche de la magie, mais premier degré,là, je suis en train de lire un bouquindu fondateur de Keras,qui dit lui-même qu'il y a des choses, c'est de la magie.
00:49:52 :Donc, on sait ce qui se passe de manière générale,on sait comment ça fonctionne,mais quand on travaille avec, je sais pas,10 milliards de neurones,à la fin, on sait pas ce qui se passe.
00:50:02 :Ça marche, très bien.Non, je caricature, mais il y a des trucs...En fait, il y a une partie entreles différentes layers,on sait pas ce qui se passe, parce qu'on...
00:50:12 :On s'en fout de le savoir, quoi.Bon, c'est modo.Du coup, Anos,j'ai répondu à ta question quand t'étais pas là.Ah non, euh...Peux-tu écrire le nomde la lettre que t'es en train de lire, s'il te plaît ?
00:50:26 :Tu parles du deep learning ?T'auras ?Ok, alors, je suis en train de lirecelui-ci.Euh...Après, c'est un bouquinqui est assez costaud, donc si t'as pas faitde machine learning,avant,fais-en, parce quepour le coup, il est pas...
00:50:48 :Je connais pas ton niveau, maisil faut vraiment avoir les bases.Sinon, ça va être un peu compliqué, quoi.Tiens, c'est celui-là.Euh...On pourrait bien comprendre le raisonnementde la machine. Non, mais là,
00:51:02 :y'a même pas d'explanation.Entre layers, on sait pasce qu'il se passe.C'est comme ça.C'est une loi informatique en IAqui te dit que, en gros, on lanceet en fait, vu que c'est un système debackpropagation, donc c'est des dérivéspartiels, ben en fait, on sait pas.
00:51:20 :Des fois, ça va plus êtrecertains neurones qui vont être concentréset d'autres qui vont être moins concentrés, etc.Donc...Peut-être une image pourcomprendre un peu ce que je dis.
00:51:32 :Tensorflowboard.Peut-être que c'est ça.La tensorboard.Voilà, c'est bien ce truc en plus.Je sais plus où elle était.Derrière-droit.Je vais voir si je peux la retrouver.
00:52:02 :Ok.Ça y est, je l'ai retrouvée.Alors, où est-ce qu'il est?Ok, j'ai trouvé le site en questionalors je vais te montrer.En question, alors je vais te montrer.
00:52:30 :De quoi je parle.Je vais te présenter un petit peu tout ça.Ce que je te disais,si t'es intéressé par savoir qu'est-ce qui marche,qu'est-ce qui marche pas.
00:52:52 :Donc là, c'est hors-sujet.Là, je vais faire un petitparallèle de ce que j'ai dit.Là, on rentre dans le côté obscur de la force.
00:53:02 :Donc en fait, à la place,là j'ai mes entrées, toujours pareil.Là, j'ai une tâche dej'aimerais faire par exemplelà j'ai4 ensembles,les oranges, les oranges, les bleus, les bleus.
00:53:18 :Et moi, j'aimerais les séparer.Donc en fait, ce que je te disais, c'est que tu auras des entrées,tu vas configurer,et en fait, tu vas ajouter des layersou tu vas en supprimer. Donc ça, c'est tes réseaux de neurones.
00:53:28 :Quand tu vas ajouter tes neurones,que tu vas lancer,hop,là tu vois qu'en fait,les neurones qui vont être les plus importants,qui vont avoir le poids le plus important, c'est x1 et x2.
00:53:40 :Par exemple, x12 et x22,bah en fait, ils vont servir en rien.Donc quand je vais les enlever,je vais quand même réussir.Ils vont se séparer. Alors moi, du coup,
00:53:50 :je vais bien m'en chier.Donc après, vous avez des tâchesun peu plus compliquées. Si je prends ça, par exemple,bah là, jusqu'à 4 neurones,ça ne va pas suffire.
00:54:00 :Là, il faut augmenterun petit peula taille en entrée.Donc là, il y a toujours 2 neurones,puisqu'il y a 2 classes.Donc là, parfois, l'algorithme,il a du mal, en fait, àséparerles deux ensembles. Là, on a les courbes
00:54:18 :d'apprentissage. Elles sont un peu à chierparce qu'il n'arrive pas à les faire, parce que c'est trop dur.Donc en fait, des fois,il faut lui rajouter...
00:54:26 :Je ne sais pas ce qu'il faut aller faire.Je crois qu'il faut...Non, j'en ai 4en entrée. Au milieu, je vais mettredes 6.
00:54:36 :Et là, je vais passer3.Non, c'est quand mêmesacrément compliqué.Hop.Oh là là, c'était juste pour faire un petit parenthèse.C'était pas un...
00:54:56 :Est-ce que j'ai une...une fin ici?Non.Ouais, je la garde.Si vous voulez vous amuser, je vais le liredans la description.Hop.C'est quand même amusant.
00:55:14 :Voilà, voilà.Est-ce que vous avezd'autres questions?Ok.Non?Petite question?Tu peux avoir des devs classiques qui bossentavec lui pour faire une applicationen ligne? Ouais. En fait, nous,
00:55:40 :tu vois, on est vraiment la partie...On est plus des chercheurs, d'accord?On va faire plus de la recherche.On n'est pastant des... Enfin, si on est des devs,
00:55:50 :mais moins qu'un dev web, par exemple, tu vois.Nous, on fait vraiment de la recherche.On va prendre un article de recherchesur, je sais pas,un truc qui vient de sortirde la dernière instance. Et ensuite, on va
00:56:02 :l'implémenter en Python ouXlangage, en Python, parce que c'est simple.Et puis, on vafaire des tests, on va analyser les courbes,donc il y a beaucoup de maths quand même. Tu vois, donc il ne faut pas négliger.
00:56:12 :Mais comme je dis tout à l'heureà Arcel Bika,il faut y allerau début, c'est tranquille. C'est-à-dire qu'onmonte crescendo. Là, ce qu'il fait
00:56:22 :mon prof, par exemple, mon tutor de stage,je suis même pas incapablede le dire.Vous êtes très loin de le dire dansl'année prochaine, peut-être. Donc,
00:56:32 :il faut y aller crescendo. Voilà, il faut y alleret on aura votre réussite.Alors, j'ai déjàcréé un salaire, et j'ai vu qu'il y avaitdes grosses lacunes en code.
00:56:42 :Bon, c'est pour ça que je lui ai fait une licenceinfo. Je ne voulais pas faire une licencede maths, parce que clairement, les maths, ça me faisaitcaguer. Moi, je voulais vraiment faire du dev
00:56:50 :avec, donc c'est pour çaque j'en ai mis les deux. Mais après,c'est vrai que les maths, des fois, ça manque.Et l'adrien, ben non,c'est pas de manger.
00:57:00 :On répond à tous mes messages.............Bon,si vous n'avez plus trop de questions,je vais devoir vous laisser.C'était pas si long quesans programmation, mais là, que c'était...
00:57:28 :Non,c'est un peu des conneries, là, pour le coup.Data science, ça dépend vraiment de...Enfin, ça dépend des gens, quoi.Donc, il ne faut pas en faire une généralité.
00:57:38 :Non, je dirais.Parce que data scientist, c'est plusdes data analyst, à la rigueur,mais pas forcément des data scientist....De rien, c'est le bicker.
00:57:50 :Et puis,à la prochaine, peut-être.J'ai des questions.Si je peux poser ma question en vif,est-ce que tu vas faire,par exemple, un événementoù tu vas nous, enfin, pas nous présenter,mais nous guider,faire des exemples de code et tout ça,comme un peu un...
00:58:10 :Du live coding, ouais. Je vais en faire un petit peu.Bah, j'en ferai un sur la classificationdes images, comme ça, ce que je dis,je vais vous coder et je vais vous montrerque ça marche.
00:58:20 :Et comment une machine, quelles sont les règles de la machinepour faire la différenciation.Parce qu'on a un truc, en fait, qui s'appelledes key points, et en fait, la machineva détecter ce qu'on appelle des anomaliesdans l'image. Et ça, c'est sympa.
00:58:32 :En plus, on l'avait fait quand je travaillais le train.Et ça marche.Et aussi, dernière petite question, est-ce que c'est vrai que pourle machine learning,deep learning et tout ça, c'est bien d'avoirbeaucoup de mémoire swap ?
00:58:44 :Tu beaucoup me dis...De mémoire swap ?La mémoire à la RAM, je pense ?Ouais, ouais, la...Ah, ouais, ouais, la RAM. Alors, pas en machine learning,
00:58:54 :mais en deep learning, ouais.En machine learning, moi, sur ma machine, j'ai 16...J'ai quoi ?J'ai 16 gigas, ça suffit.Par contre, en deep learning,je ne vais pas bientôt passer à 64.
00:59:06 :Donc la RAM, il faut vraiment l'augmenterparce que j'ai des projets où j'ai fait tourner20 millions de neuronessur un...sur la génération d'images.
00:59:18 :Donc 1 minute de journée.Ma machine, elle a crash parce qu'elle m'a ditout of memory, donc elle abugué au niveau de la RAM.
00:59:26 :Et en fait, ça...ça prompt, hein. C'est des trucs.Après, ça se fait tourner sur datasensor, c'est pas pour rien.Moi, mon desktoppour faire du deep learning, j'ai uneRTX 3050,un Ryzen 5 5800X,et...
00:59:44 :Heureusement que j'ai la... Comment ça s'appelle ?La...Les ventilosqui marchent bien parce qu'en plus,ça fume. Enfin, ça fume, ça tire, quoi.Des fois, les entraînements, ça dure, bah...
00:59:56 :48 heures.2-3 jours, pour les petits salgos.Dis-toi que pour faireentraîner... Alors là, on parle surdata center, donc on parle vraiment sur des dizainesde milliers de GPU.
01:00:08 :Ta GPT, ça a duré6 mois, l'entraînement.Pour te dire le...La taille que ça a mis, quoi.Il commençait à peine, l'information.On peut jouer de leur puissance de calcul, donc selonle crédit PC, ça doit être rentable delouer de la puissance de calcul.
01:00:24 :Il y a pas mal de trucs comme Googleeuh...Comment ça s'appelle, là ?Les mGoogle, je sais plus où m'installer.Ah, merde.Alors, c'est pas Google Drive, c'est GoogleAzure.
01:00:38 :J'ai plus le nom.Colab, voilà.Google Colab, en fait, on peut louer des GPU,des TPU, et pas des CPU.Pour faire tourner les machines.
01:00:48 :Des fois, c'est plus rentable. Par contre,tes données appartiennent à Google.Donc ça, après, côté confidentialité,je sais que par en plus, j'ai pas le droit.
01:00:56 :Je fais au secret, sur mes données,je peux pas les dévoiler comme ça.Je peux les faire tourner que, soit chez moi,ou soit chez un cluster,euh...
01:01:06 :Un computing cluster.Donc, à Marseille,là, au CNRS,il y a 3 computing clusters,donc c'est des data centers,où tu fais tourner tes codes. Donc en fait, c'est des
01:01:18 :mini-Google, quoi. Mais après,c'est beaucoup moins puissantque Google. Mais des fois,je sais qu'il y en avait un, avant les vacances de Noël,il avait fait tourner sonAlgo pendant une semaine.
01:01:30 :Et du coup, tous les autres chercheurs,ils étaient là, derrière, ils attendaient d'avoir de lapour faire,pour lancer leur calcul. Alors, c'estl'ironie, ça, parce qu'on dirait qu'on est un peu comme à l'époqueoù on attendait un par un pour fairesa tâche d'imprimante.
01:01:44 :Bah, c'est un peu pareil, sauf que c'estsous cluster, quoi. Donc ouais, des fois,ça bouffe, ça fait fondrele Groenland, les gars, comme ça.
01:01:52 :Enfin, gros, mais nous, les data engineers,on est les top1 des pollueurs, parce que vraiment,nous, oh la data, comme ça fait chauffer.Alors définition,où tu vas les porter,tu vois, ce truc là.
01:02:06 :Oui, bah, quand je l'aiswap, ouais, le truc là.Et du coup, ça, c'est bien d'en avoirbeaucoupquand t'as très peu de RAM. Par exemple,
01:02:16 :moi, j'ai, entre guillemets, un PC nul, mais8Go de RAM, pas de cartographie, tout ça, bref.Après, écoute, je vais te dire,ça dépend la taille de tes données,tu vois, et ça dépend le type de tes données.
01:02:26 :Si t'as, je sais pas, 300 images,ça suffira, ça mettra longtemps,mais ça marchera,tu vois. Si t'as 64Gode texte ou d'images, là,je te dis, t'abandonnes, parce queça va mettre trop de temps, tu vois.
01:02:40 :Donc, ça dépend, parce qu'en fait, si tu veux,il faut voir les images comme un ensemblede vecteurs, d'accord.En plus, ton vecteur, il a, je sais pas,ben, tu prends une image,d'accord, une image de 8 pixelspar 8 pixels, ça fait 64 pixels.
01:02:54 :Donc, ça fait une matrice de taille 64.Et 64,ça fait 64 dimensions,tu vois. Donc, c'est énorme.Donc, l'AirDorian, ben,du coup, c'est, parfois,ça met du temps. Là, je fais un truc
01:03:08 :surun dataset qui s'appelle MNIST, qui contienttous les numéros de0 à 9 qui ont été écrits à la main et codés.Ben, clairement, monordi met deux heures à chaque fois pour faire le traitement.
01:03:20 :Donc, là, il est àcombien, là ? Il a bientôt fini.Donc, ben, en fait,Non.Alors, il faut savoir quePyCharm, c'est un environnement de développement.
01:03:32 :Sauf que lorsque tu commences, quand tu lisestoutes les paires de ta machine, ben, tu lances sur Terminal.Simplement.Sur Terminal,parce que, du coup, ben,PyCharm, des fois, c'est bridé en RAM.
01:03:44 :Alors, moi, je sais que le mien était bridé à4 gigas, alors que j'avais 16 gigas.Et quand tu le fais,quand tu commences à,ben, quand ça commence à tomber,ben, moi, je le lance sur Terminal.
01:03:56 :Moi, quand on faisait du TAL, donc, c'est dutraitement automatique des langues, là,on fait que du texte. Ben, clairement,c'est que du Terminal. Donc, après,
01:04:04 :en fait, si tu veux, l'IDE,dedans, t'as un compte patron.............Tu vois, les Jupyter Notebooks,je les lance avec Terminal et j'ai fait tout avec Terminal.
01:04:24 :Ben, quand ça foire, je vois l'erreur, je la corrige.Après, ça se fait avec l'expérience.Mais l'IDE, c'est bienparce que tu peux lier... L'IDE, c'est
01:04:32 :pas mal pour lier quand t'as un gros projet, tu vois.Mais quand tu vas faire vraiment la phase d'entraînement,la phase d'apprentissage,ben, là, tu lances comme ça.
01:04:40 :Alors, Dataspel, non.Je connaissais pas Dataspel, pour le coup.Faut voir un peu ce que c'est.Après, moi, je suis un bon vieux paille-charme.Et pour toi, NeoVim, c'est quoi ?
01:04:50 :C'est directement le Terminal ou c'est un IDE pour toi ?Non, non, non. Oubliez les trucs,les dérivés comme ça, là, les NeoVim, etc.Là, il y en avait un, je sais plus comment,là, qui avait la photo de profilde Vim. Ça, faut arrêter.
01:05:02 :Soit vous êtes sur PowerShell, soit vous êtes sur Linux.Mais vous décidez, vous prenez des vrais Terminal.Commencez pas à inventer.Je suis sur Linux avec NeoVim.
01:05:10 :C'est pour ça que je demande.Mais quoi ? T'es sur Linux, toi ?Je suis sur Arch Linux, ouais.Terminal, voilà.CMD, pardon, Terminal, du coup.
01:05:20 :Tu le rends avec ton Terminal de base,que t'as dans ton CMD, tu vois.Faut juste que tu fasses Piston 3, Piston...Ouais, je connais la commande.
01:05:28 :Voilà.Et alors, dans le sensoù on recommande desobjets génétiques et des humains,on peut déjà le faire.Là, les réseaux de neurones qu'ils ont mis dans les Tesla,les Tesla, Colin Pradier,clairement, c'est desréseaux convolutionnels.
01:05:46 :Ça détecte les objetsaux alentours.C'est des choses qui sont bluffantes.J'avais vu une vidéo.Allez, je repartage le truc.Hop.Alors.CNN.Alors.Tac, tac, tac.
01:06:06 :Vous voyez, ça m'a misces noms-là.Réseau convolutionnel.Tesla.Alors.Là, c'est du deep learning.Là, on n'est pas du tout dans le...Là, on est sortis du sujetdu machine learning.
01:06:28 :Donc.Tac, tac, tac.Je sais qu'il y a une vidéo qui étaitsympa en plus.OK.Bon, là, qu'est-ce qu'on a ?Tac, tac.Voilà.
01:06:50 :Là, par exemple, sur la vidéo que je te montre,c'est ce que voit, entre guillemets,la Tesla.Donc, la Tesla marche.En fait, ils ont mélangédu deep learninget de l'apprentissage par renforcement.
01:07:06 :Mais ça, c'est des sujets, c'est vraiment dur.Pour le coup, ça...Je vais attendre un petit peu avant de vous le présenter.L'année prochaine, on va se faire deux, peut-être.
01:07:14 :Mais pas maintenant.Alors, tu as entendu parlerde processeur prévu pour gérer les réseaux neurones.Ouais, ça s'appelle les TPU.C'est Google qui a développé ça.
01:07:24 :Donc, c'est quoi ?C'est Google qui a développé ça.Donc, c'est pour faire de l'IA.Il y a des conflits de données,l'enavantage ou des bugs liés à l'algo ?
01:07:34 :Ah oui, bien sûr.Bien sûr. En fait, si tu veux, tout reposesur l'analysedes... Comment on s'appelle ?Des cours. C'est-à-dire que des cours d'apprentissage.
01:07:44 :Comment ça va être ? Par exemple,les fonctions d'erreur et tout.Bon, là, je prends le casde KNN.Si, au bout de deux voisins, il a un score de 100%,alors, avoir un score de 100%,c'est avoir un score parfait.
01:07:58 :Sauf qu'avoir un score parfait,on n'est pas dans un monde parfait.Donc, en général, lorsqu'on a un score parfait,c'est qu'il y a une couille quelque part.
01:08:06 :Donc, un problème de vecteur, de dimension, etc.D'accord.Fonctionnement analogique, ça, j'en sais rien.J'utilise un computer.Oui, bien sûr.Euh...Euh...Sur un...Je vérifie.
01:08:24 :Non, mais après, ce qui se passe, c'est que je fais le sur unGoogle...Un Google machin, là.Ah, zut !Merde, j'ai oublié ce nom.
01:08:34 :Enfin, les trucs de Google pour le code,c'est gratuit.Donc, ça sera plus simple.Ça bouffe moins d'énergie.Peut-être.Après, moi, je fais tourner sur GPU.
01:08:46 :Je sais que je suis un grosconsommateur de GPU, mais je me dis de l'acheter pour ça.Donc, oui, j'ai payé 500 balles pour acheter un GPU.
01:08:52 :Mais...C'est pas pour faire de la crypto-monnaie.Vous avez encore des questions ?Faut aller faire dodo ?Non, je rigole.Je suis un peu critique.
01:09:24 :Après, si vous aimez, il y a des gens en Instagramsur vos trucs. Il y a Evolving.iequi est pas malpour les nouvelles technologies.
01:09:32 :Ça vous montre un peuce qu'il se passe.C'est sympa, toi, je trouve.Plus vous aurezde l'information et plus vous...Voilà, vous saurez faire le tri et vous direqu'est-ce qu'il faut.
Aucune occurrence trouvée pour « ».