Session du lundi 22 juillet à 20:30

Session du 22 juillet 2024 à 20h30

Data Science & IA

CNN - Convolutional Neural Network

Session Discord dédiée aux Réseau neuronal convolutif (CNN) faisant suite à la session récente sur le Deep Learning.

Rechercher dans la transcription

00:00:00 :Merci d'être venu pour cette nouvelle vidéo sur les réseaux convolutifs qui sont une famille de réseaux, donc les CNN qui font partie du deep learning, j'en ai parlé la dernière fois dans ma vidéo sur la classification des images, en fait c'est ce qui a permis vraiment d'avoir, depuis le XXe siècle, après l'extraction des caractéristiques comme on avait dit avec OpenCV,

00:00:29 :avec GIFT, SURF, etc. dans tout ce qu'on savait faire en shallow learning, c'est ce qui a vraiment permis donc les CNN de pouvoir vraiment faire des choses assez fascinantes, alors ce que je vous propose c'est d'entendre premier temps, un peu une intro duc suivante, on va en faire ensuite, on va parler un petit peu de comment on traite une image en informatique, parce que c'est bien beau de prendre un appareil photo et de tac, prendre une photo, mais comment nous mathématiquement on arrive à coder ça,

00:00:59 :on va voir ensuite qu'est ce que c'est qu'une couche de convolution, enchaîner avec une partie sur le polling, enfin on verra donc le réseau CNN et pour la dernière partie, après ce diapo, on fera un petit live coding où je vous présenterai du coup les CNN sur un jeu de données assez connu.

00:01:19 :Alors déjà dans un premier temps, les CNN ont été introduits en fait par trois mathématiciens assez connus, dont un français qui s'appelle Yann Lequin, qui est tout à gauche, qui est un des précurseurs du deep learning, c'est vraiment un des pères fondateurs.

00:01:36 :Alors les CNN en fait, pour la petite histoire, c'est apparu en fait aux Etats-Unis dans les années, fin des années 80, où en fait on s'intéressait à pouvoir scanner automatiquement les lettres de la poste, notamment reconnaître les différents numéros etc. pour l'envoi à travers le pays.

00:01:59 :Donc en fait il y a eu une gigantesque base de données qui a été créée, qui s'appelle MNIST, et cette base de données contient donc 9 chiffres, de 0 à 9, et il y en a environ 26 000, quelque chose comme ça, qui ont été répertoriés, donc des images de taille 28 par 28, en termes de pixels.

00:02:22 :Et ce sont des images qui ont en fait été scannées, mais ce ne sont pas des chiffres comme on le fait avec un ordinateur, ce sont des chiffres magnifiques.

00:02:32 :Donc ces choses là en fait ont été introduites dans le papier de recherche que j'ai mis en bas pour ceux que ça intéresse, donc en lien PDF. Niveau du papier, voilà, c'est, je crois qu'on réussit à faire quelque chose avec, en mettant du deep learning, et comme je l'expliquais dans l'intro au deep learning, il faut une énorme quantité de données, donc là on est à 26, pour faire tourner un réseau de neurones, d'accord ?

00:02:57 :Maintenant on va voir en fait comment on voit une image en informatique. Alors à gauche vous avez un merveilleux coucher de soleil de la liste de la Ciotat, que j'ai prise en matin. C'est une image de 6000 par 4000 pixels, d'accord ?

00:03:12 :Donc en fait nous ce qu'il se passe c'est qu'on va traiter des pixels avec une notion mathématique qu'on appelle des matrices. Tout simplement une matrice, vous pouvez le voir comme un tableau Excel, d'accord ? Vous avez N lignes et N colonnes, d'accord ? Et chacune des cases est numérotée entre 0 et 255, d'accord ? Donc c'est un pixel, c'est un pixel de couleur.

00:03:37 :Et tout ça en fait, on va avoir 3 tableaux différents, parce qu'on est en couleur, donc c'est du RGB, donc on va avoir les pixels pour le red, le green et le blue, d'accord ? Donc nous on va parler de matrices, d'accord ? On ne parlera plus de taille d'image, etc. Donc une matrice de taille 6000 par 4000 par 3, d'accord ? Ça c'est important que vous le sachiez, parce que quand on commence à faire du code là-dedans, on va parler au niveau des shapes, qu'est-ce que c'est, etc.

00:04:06 :Il faut vraiment être assez clair avec les notations mathématiques, parce qu'on peut vite avoir la confusion, notamment quand on va couper les datasets en prenant le train, le test, la validation, etc. Au niveau des tailles, il faut toujours vérifier qu'on ne s'est pas trompé au niveau des tailles.

00:04:21 :Quand on crée un réseau de neurones, ou même quand on fait du machine learning, etc., on contrôle souvent les tailles d'entrée, les tailles de sortie, on fait toujours un double check, d'accord ? Parce que c'est vraiment quelque chose d'assez vital.

00:04:38 :Donc maintenant le cœur du sujet, qu'est-ce que c'est qu'une couche de convolution ? Parce que vraiment le CNN c'est Convolutional Neural Network. Convolution, tout simplement, ça va être des filtres qu'on va appliquer à notre matrice, d'accord ?

00:04:55 :Donc là on a la planche, j'ai mis une matrice, d'accord ? Entre 0 et 10. Et en fait, vous voyez sur le carré vert, ce qu'il va se passer, c'est qu'il va traiter chacune des cases, d'accord ? Donc de taille, là j'ai pris 3 par 3, d'accord ? Et il va leur appliquer un calcul mathématique.

00:05:12 :Donc là, si on prend la case en haut à gauche, c'est 3, d'accord ? Il va faire 3 fois moins 1, 0 fois 0, 1 fois 1, d'accord ? Et ça, il va l'appliquer 3 fois. Et il fait l'addition de tout ça, d'accord ? Et ça va donner moins 3. Donc vous l'avez compris, l'image, en fait, on va faire ressortir des caractéristiques en appliquant une filtre. D'accord ? C'est aussi simple que ça.

00:05:37 :Donc aussi, l'image, du coup, on va diminuer, d'accord, sa taille. Donc là, on va la diminuer par 3, parce qu'on a pris un filtre de taille 3 par 3, d'accord ? Et ça, ça va permettre de pouvoir garder, en fait, imaginons, je voulais appliquer un filtre de couleur pour faire ressortir des caractéristiques telles que, je ne sais pas, des lignes horizontales, d'accord ? Eh bien, on a des filtres qui sont déjà configurés, qui nous permettent de faire cela. D'accord ?

00:06:06 :Donc vous voyez qu'en fait, l'extraction de caractéristiques comme nous, on l'entendait avec les keypoints, les descripteurs, etc., avec SIFT, SURF et BRISK. Mais là, on n'a plus besoin de la faire. On a simplement besoin d'appliquer notre matrice. On l'applique à notre image, à nos images, et ensuite, on continue à le développer. D'accord ?

00:06:25 :La seconde opération qu'on fait souvent après une couche de convolution, c'est un pooling, d'accord ? Alors un pooling, on en a deux. On a le max pooling et l'average pooling. Alors ce n'est pas très compliqué, en fait. A gauche, donc le max pooling, on prend une zone, d'accord ? Donc là, si je prends le carré rose, on va prendre la valeur maximale de ce carré rose, d'accord ? Et à chaque fois, on va prendre le max de ce petit carré. Et pareil, ça va diminuer, tac, tac, tac, notre couche, notre image de base, d'accord ?

00:06:55 :Enfin, récap, on a eu l'image, on a appliqué une couche de convolution, et le max pooling ou l'average, en la vraie, c'est juste prendre la moyenne, tout simplement, de notre carré. Je vais récupérer les éléments essentiels de ma couche de convolution, d'accord ? Et en fait, tout simplement, c'est un réseau de CNN, d'accord ?

00:07:17 :On va répéter cela plusieurs fois, d'accord ? Jusqu'à avoir une image, finalement, qui, au début, si on a une entrée de 256 par 256, on peut arriver jusqu'à une image de 10 par 10, d'accord ? Qui est récapitulative de notre image de base. Pourquoi on fait ça ? Parce que ça nous permet de faire ressortir des caractéristiques principales pour ensuite faire notre couche fully connected, d'accord ? Donc ça, c'est ce que je vous ai expliqué la dernière fois pour faire notre classification, d'accord ?

00:07:46 :Là, on a appliqué deux fois convolution, pooling, convolution, pooling, ici, pour ensuite avoir ces petits carrés-là, d'accord ? Et quand on a terminé avec cela, en fait, avant de faire notre prédiction, on va faire ce qu'on appelle un flatten.

00:08:01 :Alors un flatten, simplement, c'est quelque chose qu'on fait souvent avec, à la fin, quand on traite des images. On est d'accord que là, on parle de matrice, d'accord ? Donc une matrice, on a une ligne et une colonne. En fait, un flatten, ça va, en fait, si vous voulez, vectoriser notre matrice. C'est-à-dire qu'on va avoir une seule colonne ou une seule ligne, d'accord ? Qui va contenir tous nos éléments, d'accord ?

00:08:25 :Par exemple, si je prends une matrice de taille 8 par 8, d'accord ? Et si je fais un flatten, ça va me donner un vecteur de taille 1 fois 64, parce que 8 fois 8, d'accord ?

00:08:37 :Ben voilà, c'est simplement ça, les CNN, donc c'est très rapide à comprendre. Et ensuite, je vais faire des prédictions. Donc vous voyez que là, vraiment, dans l'architecture, on n'a plus d'extraction de caractéristiques, on n'a plus ces choses-là, on a vraiment quelque chose qui est beaucoup plus simple et qui fonctionne, du coup.

00:08:52 :Donc maintenant, ce que je vous propose de faire, c'est là, juste, on peut faire peut-être deux minutes pour poser un petit peu des questions, d'accord ? Et après, je vais ensuite passer au code pour vous montrer vraiment comment ça marche exactement.

00:09:06 :Est-ce que, par exemple, vous avez des questions sur ce qu'on vient de voir à l'instant ?Moi, je voulais voir un truc aussi, c'était, quand tu fais la convolution justement et le pooling, tu traites, en fait, voilà, des parties de ton image et tu récupères donc, en fait, que la partie qui t'intéresse, si tu fais le max pooling ou le average pooling, et du coup, tu perds forcément en qualité de données, non ?

00:09:30 :C'est ça qui joue sur la mise, comment on appelle ça, la marge d'erreur de l'IA, quoi, quand tu as fait le traitement, quoi.Alors ça, c'est une bonne question. En fait, je suis d'accord avec toi, tu vas perdre, en fait, au niveau des features, tu perds au niveau des caractéristiques, mais vu que ça t'a fait ressortir, en fait, sur une image, par exemple, là, si je prends l'image des bateaux ici, tu vois, pour savoir si c'est un boat, en fait, tu te rends compte que sur l'image, des fois, tu as des choses qui ne te servent pas, en fait.

00:10:01 :Par exemple, tu veux savoir forcément que tu as la forme d'un bateau, d'accord, donc ça, ça peut être quelque chose qui peut être extrait par ton filtre, d'accord, si je prends un filtre. Alors, des filtres, il en existe vraiment plein, d'accord. En général, nous, on fait des filtres assez simples qui ont été déjà créés par des librairies, etc., mais imaginons, il y a des filtres qu'il faut être appliqués pour récupérer, ben voilà, la forme de la coque, tu vois.

00:10:26 :Ben ça, ça suffit à savoir, au réseau, comment il va pouvoir différencier. S'il trouve que cette forme-là n'apparaît pas, donc il n'y a que des pixels à zéro, tu vois, ben là, en fait, les pixels à zéro, ils vont être broyés, tu vois. Là, quand je vais faire un max pooling, il va récupérer finalement que les couleurs qui sont proches de 255, d'accord, mais il y a des pixels, en fait, qui ne vont servir à rien, tu vois.

00:10:49 :Par exemple, si je prends une zone, alors là, c'est peut-être un peu mieux expliqué. Là, le max pooling, tu vois qu'en fait, les pixels 45, 48, 52, 44, ils sont assez proches. Donc là, on peut dire que ça peut faire une forme assez carrée, tu vois. Mais 1, 2, 1, 2, 3, c'est un peu d'éléments parasites, finalement, qui, ça va un petit peu empêcher. Ben c'est pour ça, en fait, qu'on fait un max pooling et pas un average, par exemple, pour vraiment récupérer ces caractéristiques qui sont importantes, tu vois.

00:11:18 :Alors après, ça dépend des fois, il faut tester. Souvent, en fait, c'est là qu'on va parler un petit peu, on va y aller un petit peu à tâton, c'est-à-dire qu'on n'a pas une... ça, c'est une base, d'accord, d'architecture. Il y en existe plein, tu vois.

00:11:31 :Eux, c'est ce qu'ils se sont inspirés pour faire leur... quand je parle d'eux, c'est Yann Lequin, etc., pour faire Ponvnet, sur Datasette, là. C'est quelque chose comme ça qu'ils se sont inspirés.

00:11:41 :Après, aujourd'hui, maintenant, t'as différentes façons de coder une architecture qui est basée sur des CNN, tu vois. Par exemple, ce que tu peux faire, c'est mettre deux couches de convolution à côté, d'accord, voire 4 ou 5.

00:11:54 :Et ensuite, mettre juste un pooling, et après, tu passes en Fully Connected, tu vois. T'es pas obligé de suivre l'architecture telle qu'elle est, tu vois. Tu peux l'améliorer, etc., quoi.

00:12:08 :Ouais, en fonction de ce que t'as besoin, tu peux choisir, tu fais plus les convolutions, les poolings, d'accord, ok, je comprends.Bah en fait, ce qui va se passer, c'est ça que tu vas le savoir, que lorsque tu vas pouvoir faire tourner la molinette, que tu vas tester ton réseau, j'ai un petit exemple tout à l'heure, où en fait, tu vas te rendre compte que quand tu vas calculer tes scores, etc., ta fonction de perte et tout,

00:12:30 :si t'as un score qui est à 50%, c'est-à-dire que t'as une chance sur 2 de te planter sur... si t'as deux classes, d'accord, si t'as les chiens et des chats, tu vois, t'as une chance sur 2 de te planter,

00:12:41 :bah là, en fait, tu vas améliorer progressivement et ça, en fait, tu vas développer des techniques, tu te dis, bon, bah là, je vais essayer de mettre un peu plus de convolutions.

00:12:48 :Au lieu de prendre que 2 pixels par 10 pixels, je vais agrandir, je vais prendre 10 pixels par 10 pixels, tu vois, si tu travailles sur des grosses images.

00:12:55 :Après, vraiment, ça dépend. Là, tu vois, c'est quelque chose que... c'est vraiment le data scientist ou l'ingénieur en IA qui va se charger de faire des tests parce qu'il n'y a pas une baseline sur...

00:13:06 :quand tu fais des modèles comme ça. C'est des modèles statistiques, donc vraiment, tu peux que te rapprocher d'une architecture. Il n'y a pas une architecture idéale, quoi.

00:13:15 :Tu peux juste te rapprocher de quelque chose qui va être... qui va pouvoir répondre ou pas à tes... à ton besoin, quoi.Ok, ça marche.

00:13:27 :Ok. Est-ce que d'autres personnes ont des questions ? Donc, on commence en live coding.Non. Bon. Alors, du coup, tac, hop.Alors, je me connecte sur mon numéro chez moi. Hop là. Tac.

00:13:53 :Alors, tout ça, ce qu'on va faire, c'est sur du Jupyter Notebook, d'accord ? Là, j'estime que sur cette vidéo, vous avez un peu les bases en Python, d'accord ?

00:14:02 :Parce que je ne vais pas reprendre un petit peu la... comment ça fonctionne, mais un Jupyter Notebook, d'accord, c'est du Python.Ok, simplement, en fait, ce qu'on va faire, c'est qu'on va... pour ne pas relancer le code à chaque fois, on va créer des notebooks, d'accord ?

00:14:17 :Donc, je vais créer un Jupyter Notebook.Donc, dans un premier temps, la première chose qu'on fait dans un projet en Python, en Java, en C, ce que vous voulez, c'est d'importer les librairies.

00:14:29 :Donc, la librairie, pour vraiment faire de la... comment ça s'appelle ? Du deep learning, d'accord, qui est assez connue, c'est la librairie Keras, d'accord ?

00:14:39 :C'est une librairie qui est vraiment bien parce qu'il y a déjà des layers qui sont... on peut vraiment coder des layers proprement, on peut relire, etc.

00:14:48 :Alors, Keras, ça a été une librairie qui a été créée par François Chollet, c'est un français, et ensuite, elle a été intégrée à TensorFlow, qui est une librairie développée par Google.

00:14:58 :Donc, c'est quelque chose qui est assez récent, qui est maintenu. Vous avez une documentation de fou sur Internet.Enfin, c'est vraiment quelque chose qui est resté solide pour faire du... comment ça s'appelle ? De l'IA.

00:15:09 :Ensuite, ce qu'on va faire, alors, on va importer les layers. Donc, from Keras, import layers, fait avec les modèles.Ça, ça va nous permettre, en fait, de pouvoir créer nos couches de convolution, notre maxPooling, notre ridgePooling, ou de notre flatten, d'accord ?

00:15:29 :Ensuite, depuis Keras, on va importer le dataset NMIST, sur lequel on va faire notre application.Donc, rappelez-vous, c'est un dataset qui contient 9 classes, d'accord ?

00:15:41 :On va importer aussi Matplotlib, qui permet de visualiser un petit peu les données que nous avons dans notre dataset.On va importer NumPy, qui est pour générer, en fait, des matrices.

00:15:57 :Voilà. Donc là, c'est good.Alors, quand on va charger, en fait, le NMIST, ce qui va nous renvoyer, ce sont deux tubes.Un tube qui va servir, en fait, pour l'entraînement de notre IA, d'accord ?

00:16:11 :Et un tube qui va nous permettre de tester et d'évaluer un petit peu les performances, d'accord ?Donc, on appelle ça le train et le test.

00:16:19 :Il y a deux tubes qui contiennent deux éléments, un X-train et un Y-train.Rappelez-vous, je vous ai dit, il faut toujours avoir une source et une target, quand on fait du supervisé.

00:16:30 :Donc, en fait, la source, c'est notre image, la target, c'est le label.Donc, le label, c'est les chiffres qu'on aimerait récupérer, d'accord ?Alors, MNIST.loadData.

00:16:43 :Donc là, je vais load mon data.Et la première chose que je fais toujours, d'accord ?Comme je vous ai dit, c'est déjà de regarder un petit peu les tailles de nos entrées, d'accord ?

00:16:56 :Donc, vous avez une fonction qui s'appelle shape qui nous permet de voir un petit peu les dimensions de nos matrices.Donc, la première dimension est de 60 000 images de taille 28 par 28.

00:17:07 :La deuxième de 10 000 de taille 28 par 28.Donc maintenant, ce qu'on va pouvoir essayer de faire déjà, c'est de voir à quoi ça correspond une image, en fait.

00:17:17 :Parce que ça, c'est bien beau de connaître ça. Je vous ai dit, c'est un peu du manuscrit.Mais du coup, vous ne pouvez peut-être pas me croire.

00:17:24 :Alors voici une image telle qu'elle est.Donc là, j'ai pris l'image 0 de mon tableau X-train, d'accord ?Donc là, on voit que c'est un chiffre 5.

00:17:34 :Je vais aussi afficher le label en question pour vérifier que je vois bien le chiffre 5.Alors, il faut savoir que des fois, dans MNIST, en fait, nous, on ne les voit pas très très bien.

00:17:42 :Donc là, c'est bien le chiffre 5 qui s'affiche.Je peux faire un autre test. Par exemple, 64.Je teste. Et là, je vois bien le chiffre 4, d'accord ?

00:17:55 :Donc nous, on va réaliser une IA qui va pouvoir se baser sur la classification de ces chiffres-là, de ces données-là.On a de la chance, MNIST, en fait, vu que c'est un dataset qui est vraiment super connu et qui est directement dans la librairie Keras,les données sont déjà labellisées et sont déjà propres,

00:18:15 :propres dans le sens où, en fait, toutes les images font la même dimension.Parfois, lorsque vous importez des datasets qui viennent, par exemple, d'un site qui s'appelle Kaggle ou d'un autre site qui va s'appeler Hugging Face, vous avez des images qui sont de tailles différentes.

00:18:30 :Donc ce sera à vous de pouvoir les normaliser pour pouvoir avoir une certaine flexibilité et avoir un contrôle là-dessus.Maintenant, ce qu'on va faire, c'est... Donc la première étape avant de faire tout ça, ça va être de faire du data processing, d'accord ?

00:18:48 :C'est une étape assez cruciale qu'on fait souvent quand on fait de l'IA, d'accord ?C'est-à-dire qu'on va pouvoir établir des techniques pour un petit peu laver un petit peu nos données, d'accord ?

00:18:59 :Alors, pourquoi laver nos données ?Si je prends, en fait, l'extrême de 64, par exemple, d'accord ?Et je regarde, par exemple, le type de la valeur 0 de mon tableau.

00:19:14 :Hop, je mets une parenthèse.On se rend compte, donc on a un tableau, un tableau d'empaie, d'accord ?On va enlever... Voilà.Là, ce qu'on a, c'est un tableau d'empaie, mais ce qui pose le problème, c'est qu'en fait, le datatype, c'est un UINT8, d'accord ?

00:19:32 :Et ça, on n'aime pas trop quand on fait de l'IA, d'accord ?On aime bien souvent être en float 32, ok ?Donc, une manière de faire qui est assez courante, d'accord ?

00:19:42 :C'est de convertir tout le dataset, donc l'extrême et l'extrême, en float 32, d'accord ?Donc c'est ce que je vous propose de faire.Tac.Ok.

00:20:01 :Et de diviner tout ça par 255.Pourquoi 255 ? Parce que ça nous permet d'avoir des images qui sont directement confluites entre 0 et 1, d'accord ?

00:20:11 :On normalise par... Pourquoi 255 ? Parce que c'est la valeur maximale que peut prendre un pixel, d'accord ?Donc c'est pour ça qu'on fait ceci.

00:20:20 :On va le faire aussi pour le X-Test.Alors, qu'est-ce qu'on a comme gains ? On a aussi un gain de performance, d'accord ?Parce que quand on travaille des valeurs entre 0 et 1, la machine va beaucoup plus vite, d'accord ?

00:20:30 :Là, à l'occurrence, on n'a pas besoin de faire tourner notre calcul sur un GPU.On le fera que sur CPU pour cette vidéo-là.Mais sur la prochaine vidéo, lorsque je vais parler des génératives adversaires network,donc les gains pour faire des IA génératives,en général, on fait tourner sur GPU parce que le temps de traitement peut dépasser vraiment...

00:20:49 :Ça peut être vraiment catastrophique, quoi.Donc maintenant, une chose qu'on va faire quand on regarde notre X-Train plancher.Donc je vous ai montré ici.On a du 28 par 28, d'accord ?

00:21:00 :Mais rappelez-vous, une image, elle est sur trois dimensions.On a d'abord la Height, la Width, donc largeur-longueur.Et on a souvent aussi... Il faut rajouter en fait une dimension pour dire...

00:21:12 :Quand j'ai une image en couleur, je suis sur 3 channels, donc RGB, d'accord ?Mais quand je suis sur une image en noir et blanc, je ne suis sur qu'un channel.

00:21:25 :Alors là, il faut savoir que les images qu'on a ici, d'accord ?Donc quand j'ai fait un PFT pour IamShow, ok ?Ma plugtip, en fait, dans sa fonction IamShow, l'a réalisée en couleur.

00:21:35 :Mais là, vous vous rendez bien compte que du coup, quand on a du 28 par 28,on n'est qu'en noir et blanc, d'accord ?Mais il faut quand même rajouter une dimension en plus,pour avoir en fait une matrice en 4 dimensions.

00:21:46 :La première dimension sera le nombre d'images que vous avez.Celle-ci sera la largeur et la longueur.Et la troisième correspondra du coup à le fait de dire à la machine que c'est une image en noir et blanc, d'accord ?

00:22:00 :Donc en fait, on peut le faire assez rapidement avec une fonction qui s'appelle Expand de NumPy.Alors NP, c'est le diminutif de NumPy, d'accord ?

00:22:07 :Quand je l'ai fait dans les imports, j'ai mis un ASNP.C'est beaucoup plus simple comme ça, on s'embête pas à pouvoir tout recopier.Et on va ajouter ceci, d'accord ?

00:22:17 :On va faire pareil pour le Xtest, d'accord ?Tout ce qu'on applique à Xtrain s'applique aussi à Xtest, ok ?Voilà, ok.Alors, il me le majuscule, voilà.

00:22:35 :Maintenant, le premier réflexe qu'il faut faire, je vous le disais,c'est de souvent vérifier les dimensions.Ça, c'est quelque chose qu'il faut vraiment avoir comme réflexe.

00:22:43 :Je vous dis ça par expérience parce que souvent,ça arrive vraiment de se faire avoir bêtement sur ce truc-là.Donc là, on voit bien qu'on est bien en matrice de dimension 4, ok ?

00:22:54 :C'est bon pour tout le monde ?Ok, alors maintenant, quelque chose qu'on va pouvoir faire en fait,alors là, on va passer avec les labels maintenant.

00:23:04 :On a, comme on dit, 8 types de labels, d'accord ?Lorsque je regarde un petit peu les valeurs que je vais avoir dans mon Ytrain, d'accord ?

00:23:12 :Donc avec la fonction NP unique, je me rends compte que j'ai 10 chiffres possibles, d'accord ?Moi, ça, c'est un petit peu problématique.C'est-à-dire qu'on peut améliorer ça en disant par exemple,si on prenait, là, on est bien d'accord que Ytrain, d'accord ?

00:23:29 :Lorsque je vais regarder sa dimension, donc je vous laisse deviner,on est bien sur un vecteur, d'accord ?Une matrice de dimension 1.On a bien 6000, alors quand on n'est virgule rien, 6,1, d'accord ?

00:23:42 :C'est par convention.On est sur un vecteur ligne, d'accord ?Donc, ce qui va se passer, c'est que nous, on va le transformer ça en dimension 6010.

00:23:52 :Pourquoi ? Parce qu'en fait, on va faire ce qu'on appelle un right-hook coding,c'est-à-dire qu'on va encoder nos Y.Je m'explique.Chaque valeur d'Ytrain, d'accord, d'image,au lieu d'être attribuée à une valeur 1, 2 ou 3,elle va être attribuée à un tableau de 0 et il va y avoir le chiffre 1, d'accord, qui va être à la position du label.

00:24:20 :Si je prends le cas, par exemple, de l'image que je vois au-dessus qui est attribuée au chiffre 4, d'accord,elle va être attribuée à un tableau de dimension 10, de 0,mais à la 4ème place, il y aura un 1, d'accord ?

00:24:37 :C'est une façon de pouvoir catégoriser de manière assez simple ce chose-là, d'accord ?Donc, c'est ce qu'on va faire directement avec nos labels, donc Ytrain et Ytrest.

00:24:48 :Pour ce faire, vous avez une fonction de Keras qui est assez bien, c'est Keras.utils.toCategoryCrawl.Donc, il prend en paramètre Ytrain, d'accord,et le nombre de classes. Là, en nombre de classes, nous en avons 10.

00:25:08 :Donc on en met 10, ok.Je n'oublie pas de faire ça aussi pour le test.Voilà. Donc maintenant, qu'est-ce qu'on fait ?On vérifie bien nos dimensions.

00:25:25 :Voilà. On a bien quelque chose.Alors, juste 10, 10.Hum, ça c'est bizarre.Ok, j'ai dû peut-être faire une erreur plus haut.Bon, on le regardera tout à l'heure.

00:25:46 :Alors, maintenant, autre chose qu'on va pouvoir faire,donc ça, ça va être en fait la dernière étape de tout notre preprocessing, d'accord,c'est en fait dans nos données de train, on va garder en fait une petite place, d'accord,pour faire ce qu'on appelle la validation.

00:26:04 :Alors, comme vous le savez, le train va permettre de faire l'entraînement de notre IA,le test de tester, etc., d'analyser les performances,mais il faut qu'on puisse tester aussi nos images sur des données qui n'ont jamais été vues par la machine, d'accord.

00:26:20 :Et ça, c'est ce qu'on va appeler une étape de validation, ok.C'est comme si on plaçait notre IA en conditions réelles, d'accord,et qu'on regardait un petit peu ce qu'elle faisait, ok.

00:26:31 :Donc ça, c'est ce qu'on va faire directement.On va prendre en fait un xval, je pourrais le dire, d'accord.Donc on va lui dire de prendre, hop, voilà, tac.

00:26:46 :Là, ensuite, on va appeler un partial xtrain.Donc notre xtrain, je l'ai découpé en deux choses, d'accord,un de taille 10 000 et l'autre de prendre de 0 à 10 000, d'accord,donc c'est les 10 000 premières valeurs, et le partial xtrain, d'accord,il va être égal à xtrain, et je vais prendre du coup les 10 000 dernières,

00:27:11 :à partir de 10 000 jusqu'à la fin, d'accord.Ça, c'était des petits tics qu'on apprend quand on fait du numpy.Pareil lorsque je vais pouvoir faire mon yval, d'accord,puisque les étiquettes sont liées avec l'entrée.

00:27:26 :Et ça, c'est ce que tu expliquais l'autre coup, c'est ça,c'est-à-dire que tu as une partie de tes données qui te servent à t'entraîner et l'autre partie qui te sert à tester.

00:27:36 :En fait, ce qui se passe, c'est que l'autre fois,quand j'avais parlé en machine learning,il y a quelque chose que j'ai dit, notre façon de faire,qu'on pourrait, alors, en général, on fait un train test suite,c'est-à-dire qu'on fait un train et un test seulement,on prend soit 110% du dataset pour faire un train et 30% pour faire un test,

00:27:54 :mais vraiment, si on veut rentrer dans un cadre,quand on veut avoir une vérité terrain,une vérité, une performance, analyser une performance assez réelle, d'accord,on rajoute un troisième tout ensemble, d'accord, qui va permettre de valider.

00:28:10 :Par la suite, je vais te montrer, en fait, tu vas voir que il va y avoir, en fait, un entraînement de machine et il va y avoir une phase de validation, ok ?

00:28:19 :Donc ça, c'est bon.Ensuite, ce qu'on va pouvoir faire, c'est construire notre modèle.Donc, tout simplement, notre modèle, ça va être notre réseau de neurones, ok ?

00:28:29 :Donc, comme je l'ai fait au début, on va créer ce qu'on appelle un modèle séquentiel.Pourquoi un modèle séquentiel ?Parce que, sur mon Japan 1, je viens de gauche à droite, d'accord,lorsque je vais faire mes différentes couches de convolution.

00:28:42 :Parfois, dans certaines architectures, vous avez, en fait, des modèles qui sont en forme de U, d'accord ?Ça, c'est tout dépend des réseaux, d'accord ?

00:28:51 :Nous, vu qu'on a, en fait, des réseaux assez simples, d'accord,on va réciter sur quelque chose d'assez simple, voilà.Donc, souvenez-vous, la première chose à faire, dans un modèle de CNN,comme je vous ai montré, c'est d'ajouter une couche de convolution, d'accord ?

00:29:07 :Donc, par la fonction conv2d, ok ?Prendre plusieurs choses en paramètres.Alors, elle va prendre un batch size de 42, 32, par exemple,un kernel size.

00:29:19 :Donc, le kernel size, ça va être, en fait, la dimension du petit carré que je vous ai montré,qui va pouvoir, en fait, appliquer le filtre, d'accord ?

00:29:33 :On va appliquer ce qu'on appelle une fonction d'activation.Alors, ça, je vous en parlerai plus tard, d'accord ?Je la place ici, parce qu'il faut que je la mette pour qu'on soit dans mon réseau, d'accord ?

00:29:42 :Ça, si les personnes ont...Rappelez-vous, quand on a fait l'introduction au deep learning,j'ai dit qu'en fait, les neurones, parfois, certains s'activaient,et d'autres ne s'activaient pas, d'accord ?

00:29:54 :Mais ça, c'est une autre fonction qui permet de faire ça.C'est une fonction d'activation, ok ?Mais on verra tout ça dans une prochaine vidéo, plus en détail,parce que là, c'est vrai qu'il y a pas mal de petits paramètres comme ça pour que la configuration...

00:30:07 :Mais en fait, c'est plus en pratique qu'on va pouvoir s'en servir et qu'on va comprendre.Donc, le dernier paramètre, en fait, ça va être un input shape qui va correspondre à ma taille entrée.

00:30:15 :Donc j'ai bien 28 par 28 par 1, ok ?La deuxième chose à faire, ça va être d'ajouter une couche...Alors moi, j'aime bien faire un max pooling, d'accord ?

00:30:25 :Parce qu'en average, souvent, on a vu que dans l'exemple tout à l'heure,ça prend pas forcément les...Ça fait une moyenne, mais là, dans ce qu'on veut,c'est pas important de faire une moyenne.

00:30:40 :On pourra tester par la suite, si vous voulez,si on a un petit peu de temps, de changer par un average, de comparer.Mais là, dans ce dataset-là, on verra pas de réelle différence.

00:30:50 :Parfois, quand on fait, par exemple, sur d'autres sujets,sur d'autres datasets, d'accord ?On a besoin de prendre, par exemple, une moyenne plutôt que de faire un max, d'accord ?

00:31:01 :Notamment quand on va faire de la...C'est pas du traitement sur de la peinture.Alors maintenant, les CNN aussi,là, je l'applique sur de la peinture, sur des images,parce que c'est la base que ça a été fait.

00:31:12 :Maintenant, je sais que les CNN, ça peut s'appliquer aussi sur du texte.D'accord ?Donc il y a plusieurs types de données qu'on peut vraiment montrer.

00:31:19 :Donc là, on a bien la couche de convolution,le max pool 2D, d'accord ?Ça, on va le faire deux fois, ok ?Pourquoi ? Parce que quand on l'a mis dans notre réseau,

00:31:30 :on va essayer de diminuer notre image pour qu'elle soit vraiment très petite, d'accord ?Et ensuite, quand je vais terminer de faire mon deuxième max pooling,je vais faire un flatten.

00:31:41 :Le flatten va pouvoir, en fait, écraser notre matrice pour la transformer en vecteur ligne ou en vecteur colonne, d'accord ?Et la dernière chose à faire, donc,ça va être d'ajouter la couche dense qui va permettre de faire la classification, d'accord ?

00:31:56 :Donc là, nous avons 10 classes.Donc, du coup, on va avoir 10 unités.Et l'activation, ça va être un surfmax.Ça veut dire que notre réseau de neurones va nous renvoyer une probabilité sur les différentes classes, d'accord ?

00:32:11 :Compris entre 0 et 1.Et la probabilité qu'il y aura la plus grande valeur sera la probabilité qui se rapproche du label qu'elle pense prédire, d'accord ?

00:32:25 :Donc là, on a fini de faire notre réseau.On peut faire, en fait, ceci.Alors, on a un petit truc.Ah, j'ai oublié un petit...

00:32:36 :Voilà, kernel-size.Tac, voilà, c'est good.On va faire aussi une fonction qui est assez sympa,qui est le modèle pour le summary,qui va nous permettre, en fait, de faire un récapitulatif de notre réseau.

00:32:50 :D'accord ?Donc là, vous avez différentes couches.Vous avez les différents nombres de paramètres, d'accord ?Les différents pixels.On peut voir qu'en total, on a 15 818 neurones.

00:33:01 :D'accord ?Donc là, rappelez-vous, les neurones,c'est les petits perceptrons que j'avais mis dans ma slide.On peut, par exemple, si on avait fait une seule couche comme ça, on peut voir que du coup,on en avait beaucoup plus.

00:33:16 :D'accord ?Donc ça, c'est quelque chose qu'il faut faire attention.C'est bien de pouvoir, en fait,délayer ce genre de choses,parce que parfois, on va pouvoir, en fait,utiliser moins de neurones.

00:33:27 :Là, on a 15 818, ce qui est assez bien.Donc ensuite, ce qu'on va faire,avant de faire le point fit,qui va être l'entraînement,on va faire cette étape-là.

00:33:38 :D'accord ?Donc cette fonction de compilation va permettre, là,de dire quel algorithme on va utiliser dans nos...Oups....BPRIA.D'accord ?Alors, je note tout en détail ce que je vous explique.

00:33:58 :Alors, catégorie...Alors, du coup, qu'est-ce qu'on fait là-dedans ?On va utiliser, en fait, trois paramètres.L'optimiser, les loss et les metrics.L'optimiser, en fait, va mettre à jour les poids qui sont utilisés par chacune des unités.

00:34:30 :D'accord ?Rappelez-vous, quand j'ai une équation qui fait la taille x1,donc x qui est égale à...Alors, c'est plus y pour le coup.Donc mon label, c'est égal à x1w1 plus x2w2, d'accord ?

00:34:44 :Plus le biais, ok ?En fait, l'optimiser va mettre à jour les valeurs de w.Ok ?La loss, du coup,ce serait la fonction de perte.

00:34:53 :D'accord ?Ça va nous permettre de détecter les pertes que fait notre machine, notre IA, d'accord ?Et la metric, qui est la stc,qui est le diminutif de accuracy, d'accord ?

00:35:04 :Ça, qui va nous permettre de savoir le score entre 0 à 100, d'accord ?Je vous rappelle, le but,c'est de se rapprocher d'un 100%, d'accord ?

00:35:10 :Pour vraiment avoir quelque chose d'assez solide, d'assez fiable.Parce qu'on est dans des modèles statistiques.Et maintenant, ce qu'on va faire,c'est tout simplement faire un point fit.

00:35:19 :D'accord ?Donc fit, ça va déclarer...à notre modèle,de pouvoir entraîner notre IA.Donc sur quoi on va faire l'entraînement ?Rappelez-vous,sur les partiels X-train, d'accord ?

00:35:30 :Que j'ai fait tout à l'heure.Avec les partiels Y-train.Ok ?Je configure un batch size de 128.Ça, je vous l'expliquerai plus tard ce que c'est ce paramètre.

00:35:43 :Maintenant, je vais appliquer ce qu'on appelle un paramètre qui s'appelle époque.Époque qui correspond, en fait,au nombre de fois que je vais faire un aller-retour pour faire la mesure de mon réseau.

00:35:53 :D'accord ?Donc, quand je vais de gauche à droite,quand j'ai fait un aller-retour,c'est un époque.Nous, il faut entraîner notre machine plusieurs fois.

00:36:01 :D'accord ?Là, en l'occurrence,on va l'entraîner 20 fois.20 fois, elle va reprendre ses données d'entraînement.Elle va les tester.Elle va faire sa mise à jour, etc.

00:36:11 :Ça, c'est la partie qu'on ne touche pas trop parce que, du coup,on ne sait pas forcément comment ça fonctionne.D'accord ?C'est la partie cachée du deep learning.

00:36:19 :Ok ?Et ensuite, je vais tester,donc, avec mes données,des validations,d'accord, qui sont les suivantes.Donc, qui sont, hop,tac,qui vont être mon xval et mon yval.

00:36:34 :Ok ?Donc, quand on est là,ensuite, qu'est-ce qu'on peut faire ?Eh bien, on peut commencer notre entraînement.Et là, on avait une petite erreur.

00:36:42 :Pourquoi ?Parce qu'on avait notre fameux problème ici.Alors, avec,donc, c'était xtrain.shape,qui teste.Alors,tac, tac, tac,utilise le calcul de calcul école.

00:37:01 :Je vais relancer des fois ce genre de choses.Voilà, donc, en fait,là, c'était juste un problème d'utilisation du message.Voilà.Et donc, là, on lance notre entraînement.

00:37:16 :Donc, l'entraînement, il est assez coûteux.D'accord ?Je peux prendre un terminal pour vous montrer les performances de mon PC.Voilà.Alors, là, par défaut, en fait,ça le fait directement sur la carte graphique.

00:37:27 :D'accord ?Là, on peut voir le pourcentage d'utilisation.Bon, mais votre carte graphique, du coup,bam, ça va partir directement à 100%.Ça, c'est quelque chose que j'ai fait.

00:37:37 :Là, il fait son entraînement.Et donc, ça, ça peut prendre vraiment pas mal de temps.C'est-à-dire que là, on peut compter,bon, là, ça va être assez rapide parce que mini, c'est quelque chose d'assez simple.

00:37:46 :On a des images de 28 par 28.Bon, c'est quelque chose d'assez facile.D'accord ?Mais là, vous avez un historique.D'accord ?De la loss, de l'accuracy,de la val-loss et de la val-accuracy.

00:37:59 :Donc, val-loss, val-accuracy,c'est les valeurs de validation.D'accord ?Quand on a fait ça, du coup,ce qu'on va pouvoir faire,c'est déjà faire une évaluation,une première évaluation.

00:38:09 :Donc, avec la fonction evaluate.D'accord ?On va prendre tout simplement notre valeur d'extest qui est avec test.Donc, learner, c'est ce que tu dis tout à l'heure.

00:38:17 :Et là, quand on va faire pour le test,on va avoir deux choses.On va avoir une liste qui va contenir deux valeurs.La valeur de perte et la valeur du pourcentage d'accuracy.

00:38:30 :Là, on a un pourcentage de 98%,ce qui est assez fort.D'accord ?Alors, c'est normal parce que, du coup,on utilise MNIST.Maintenant, on sait vraiment faire,ça fait 20 ans qu'il existe, le truc,on a des performances qui sont assez élevées parce que maintenant, c'est devenu assez simple

00:38:47 :pour pouvoir le classer.D'accord ?Donc, voilà.Là, on a fait des étapes qui sont assez représentatives de ce qu'on fait en pratique.Maintenant,ce qu'on va pouvoir faire,moi, ce que j'aime bien aussi voir,c'est de différer un petit peu les performances.

00:39:05 :D'accord ?Donc, de voir un petit peu les différentes courbes.Si on affiche les époques en fonction de la loss et de l'accuracy,de voir un petit peu ce qui se cache parce que, parfois,on va avoir des phénomènes qui sont assez étranges.

00:39:18 :Donc là, hop,je vous épargne l'attente sur le code pour refaire.Donc,tac.Donc, ça, ça va nous permettre, en fait,de tracer un graphe qui va tracer en x,donc le nombre d'époques.

00:39:34 :D'accord ?Et en y,on va pouvoir avoir,donc là, les loss,donc loss during training process,avec les données de training et les données de validation.

00:39:44 :Et qu'est-ce qu'on voit ?Alors,on voit que, déjà,l'ensemble des points sont assez proches de 0.D'accord ?Ce qui est normal parce qu'on avait une loss qui se rapprochait de 0.05.

00:39:53 :Donc, ça, c'est très bien.Et on voit qu'avec les 12 entraînements,ben, d'un coup, ça monte un petit peu.Ah !Qu'est-ce que ça veut dire, ça ?

00:40:02 :Ça, ça veut dire qu'en fait,notre machine, finalement,ben, en fait,elle va apprendre jusqu'à,on va dire,se diriger vers 0,aller à vue d'oeil 0,je ne sais pas, 0.08,

00:40:16 :un truc comme ça.Et ensuite, elle va remonter.Parfois, on a un phénomène qui est assez,assez commun quand on fait de l'IA.D'accord ?

00:40:26 :C'est quand on va regarder le training et la validation,lorsque le training va remonter d'un coup et que la validation va diminuer,que là, on va avoir un écart qui est beaucoup plus grand.

00:40:35 :Donc, si on refait, par exemple,un processus,alors, je ne sais pas si avec MMI, ça va marcher,mais si je fais un entraînement,par exemple, sur 50 époques,d'accord ?

00:40:45 :Donc, je relance tout ça pendant 50 époques et qu'ensuite, je regarde un petit peu ce qui va se passer.En fait, on va voir que parfois, ça va remonter.

00:40:55 :Quand ça va remonter,on va apprendre,il y a un phénomène qui s'appelle l'overfitting.C'est du surapprentissage.C'est-à-dire que la machine va surapprendre sur les données qu'elle va avoir en anglais.

00:41:05 :Et ça, on ne le veut pas.Pourquoi ?Parce que lorsqu'on va le tester avec des données en réel,le score, en fait,il va être complètement...

00:41:12 :il va se casser la tête.C'est-à-dire que quand je prends un enfant que je vais lui faire réviser,par exemple,sur son cours d'histoire géo,pour un contrôle,lorsqu'il va apprendre du par cœur, d'accord ?

00:41:23 :Apprendre par cœur,ce n'est pas apprendre.C'est-à-dire qu'au bout d'un moment,il ne va retenir que son texte par cœur, par cœur, par cœur.Et si, imaginons,je lui pose une question qui n'a rien...

00:41:31 :pas qu'il n'a rien à voir,mais qui n'est pas tout à fait lié avec ce qu'il a appris,mais qui est quand même lié avec son sujet,il va répondre à côté.

00:41:39 :Mais en fait,ce phénomène-là,c'est exactement ce qu'on va voir, du coup,avec notre rire.D'accord ?Donc, c'est souvent ce rapport-là qu'on fait avec l'humain pour vraiment comprendre un petit peu comment ça fonctionne.

00:41:53 :D'accord ?Donc, on va voir un petit peu si on a ce phénomène-là.Je ne suis pas sûr,mais on peut essayer de regarder.Donc là, on a fait notre entraînement sur cinq en époque.

00:42:02 :D'accord ?On fait ensuite notre test.Et voilà !Donc là, voyez,on a bien ce phénomène-là qu'on appelle du coup le overfitting.Ça veut dire que du coup,au bout d'un moment,les données étaient tellement bien dans un premier temps.

00:42:17 :D'accord ?On avait donc...Là, pour bien faire,il faudrait que je relance,en fait,pour avoir vraiment les courbes...Je vais essayer de tout relancer.

00:42:26 :Comme ça, on verra bien.Mais en fait,ce qui se passe,c'est que...Ah !J'ai beaucoup perdu l'image.Bon, elle va revenir.En fait, là,ça prend en compte l'ancien training.

00:42:36 :C'est pour ça qu'on n'a pas des losses qui sont assez bonnes.Mais voyez,quand on a vraiment cet écart-là...D'accord ?Ça, c'est ce qu'on essaie de vraiment réduire quand on fait de l'IA.

00:42:46 :Parce que ça,c'est vraiment quelque chose d'assez obscur.Alors, il y a des techniques pour pouvoir l'empêcher.Les techniques sont souvent...Alors là, je ne l'ai pas mise parce que ce n'est pas...

00:42:54 :C'est les petits toolkit que je vous apprends au fur et à mesure.Mais c'est par exemple...Tiens,je vais comparer l'accuracy sur 3 étapes.D'accord ?

00:43:07 :Si sur ces 3 étapes,je n'ai pas l'amélioration de l'accuracy,bam !J'arrête le processus de l'entraînement et je retourne le modèle.D'accord ?C'est quelque chose qui se fait assez fréquemment.

00:43:17 :On fait souvent quand on fait sur l'entraînement.Après,il y a un autre schéma qu'on pouvait regarder aussi.C'est de comparer un petit peu au niveau de l'accuracy,qu'est-ce que ça va donner.

00:43:29 :D'accord ?Donc des performances.Voilà,l'entraînement est assez rapide donc on peut attendre quelques secondes.1,44.Je pense qu'on n'aura pas trop d'overfitting là,mais on peut quand même essayer de regarder.

00:43:52 :Ah si, tu vois,on peut en avoir un.Voilà.Donc ça veut dire que d'à partir de 10 époques,on va se rendre compte que du coup, lui,il va remonter progressivement.

00:44:02 :Alors quand on a une loss,là on voit que l'écart n'est pas beaucoup,il est minimum parce qu'on est entre 0.09 et 0.1.Bon là, je suppose que c'était vraiment pour vous montrer.

00:44:11 :Mais lorsqu'on va regarder,en fait,alors là ça va être du val AC.Donc là,on va regarder un petit peu les valeurs au niveau des performances de l'accuracy.

00:44:21 :Alors,qu'est-ce qu'il n'aime pas ?Assez valieuse.Parce que peut-être que je n'ai pas assez.Je l'appelais comment déjà ?Sevelle.Alors,ACC,training process.

00:44:42 :Ah, c'est étrange.Pourquoi ça ne marche pas ?Bon,je l'ai appelé le...Non,je l'ai appelé ACC en plus.Bon,ce n'est pas important parce qu'en fait,l'accuracy,on va avoir la même chose,mais lorsqu'on va pouvoir monter.

00:45:06 :D'accord ?Donc,on va avoir quelque chose quand on va regarder les performances entre 0 et 100%.D'accord ?On va avoir ce phénomène-là aussi à 85.8.

00:45:15 :Par contre,pourquoi ça me fait ça ?Parce que c'est...Ah oui,je suis bête.En fait,on est à 51 alors qu'on est à 51 d'époque.

00:45:23 :Voilà.Donc là,on donne une performance.Donc là,on voit bien que la vidélibération,elle va se stabiliser à 98%.Nous,on va monter à 100%.

00:45:33 :D'accord ?Mais là,ce phénomène-là,c'est de l'overfitting.D'accord ?Donc,nous,on va souvent arrêter notre potel à partir de cette étape-là.D'accord ?

00:45:43 :Donc là,c'est quelque chose que je vous montre qui est assez vraiment intéressant parce que ça,c'est un truc...Là,c'est pas très...Enfin,c'est pas très très parlant.

00:45:53 :Mais là,par exemple,je suis en train de tester sur mon dataset sur des données un petit peu autres que sur du...sur du...Comment ça s'appelle ?

00:46:02 :Sur des...Sur des pots.Là,on peut voir,en fait,j'ai créé un dataset où on avait 8 classes différentes.D'accord ?Donc,si je prends le dataset que je voulais...

00:46:13 :que je voulais pas je fais ce truc.Hop.Tac.Donc ça,c'est un dataset que j'ai trouvé en ligne.Voilà.Donc là,j'ai plusieurs classes différentes.

00:46:23 :J'ai des bikes,des cars,des jogs,des machins,etc.Là,je regarde au niveau des images.Là,vous voyez que j'ai des images qui sont beaucoup plus grandes.

00:46:34 :On parle de 640 par 480.Donc,en fait,je vais devoir adapter mon réseau.Alors là,ce que j'ai pu faire,c'est par exemple de normaliser,de dire,voilà,je veux juste des images de taille 512 par 512.

00:46:48 :Et là,ce que vous pouvez constater au niveau de notre réseau,c'est qu'en fait,j'ai vraiment diminué,j'ai fait plusieurs couches de Conv2D,MaxPooling,Conv2D,MaxPooling,afin vraiment de diminuer le nombre de paramètres qu'on va utiliser par notre machine.

00:47:03 :D'accord ?Ok.Voilà.Tac.Alors,est-ce que sur ce,vous avez des questions ?Ah,du coup,j'ai fini ma présentation.Donc,j'ai des questions pour vous.

00:47:16 :Donc,je vais me mettre au silence.C'était super intéressant encore une fois.C'est cool.Je suis content que ça vous ait…Ça va ?C'était pas trop difficile à comprendre ?

00:47:31 :Vous avez réussi à…J'ai perdu personne ?Vraiment,j'ai quelque chose que vous ne comprenez pas.C'était un peu technique,mais enfin,tu as expliqué quand même.

00:47:40 :Je pense avoir compris dans les grandes lignes.Donc je pense que pour les autres,ça va être pareil.Je vais regarder un petit peu sur le serveur.

00:47:49 :Ok, oui,il y a une rediffusion.Oui, parce qu'en fait,tous les…Je ne sais pas qui a posé la question,mais du coup,toutes les vidéos,je les enregistre.

00:48:00 :Ensuite,je les mets sur ma page YouTube pour que vous puissiez les retrouver,etc.Le code est disponible sur mon GitHub.D'accord ?Donc il est en ligne.

00:48:08 :Pour vraiment pouvoir…Là,je vais mettre le lien comme ça.Hop.Je vais aller dans le truc.Ouais,j'ai fait en fait un petit repo.

00:48:20 :Il y a irsuccess,irsuccess,comme ça,vous pouvez en récupérer tout ça et tester chez vous comme ça.C'est vrai que je ne mens pas.

00:48:29 :Voilà.Et Pierre,il y a des…S'il a gué,vous avez des questions par hasard ?Bon.S'il n'y a pas de questions,j'espère que vous avez tout compris.

00:48:51 :Écoute,je vous remercie déjà pour votre attention.Merci d'avoir enregistré cette vidéo et de l'avoir…d'avoir vraiment pu la regarder,etc.J'espère que maintenant,vous allez pouvoir faire un premier step de deep learning chez vous sur vos machines.

00:49:07 :Alors là,je m'y fais tourner sur le GPU parce que je l'ai configuré de manière…de manière générale parce que je fais du deep un peu partout maintenant,donc…Par défaut,c'est ma GPU,mais sur CPU,ça fonctionne très bien.

00:49:21 :C'est quelque chose que vous pouvez faire tourner sur vos laptops,donc il n'y aura pas de soucis au niveau des versions,etc.On va juste installer TensorFlow et Keras qui prend un petit peu de temps,mais après ça,vous serez…Vous serez tranquille là-dessus,carrément.

00:49:38 :Voilà.Bon.Écoutez,sur ce,sinon,je vous souhaite une excellente soirée pour les réseaux à l'STM,qui seront un petit peu plus techniques.Cette fois-ci,j'essaierai d'avoir…d'apporter un peu plus de clarté sur certaines choses et de prendre un peu plus de temps aussi.