A quoi ça sert les maths ?·Apprendre·Chez les chercheurs·Culture mathématique·Expo de maths

L’intelligence artificielle, un exposé d’Alain Rakotomamonjy

La journée de l’APMEP Normandie d’aujourd’hui commence par une conférence sur l’intelligence artificielle – Le point de vue du Machine Learning, par Alain Rakotomamonjy (Université de Rouen Normandie – Litis). C’est très très intéressant, avec un propos parfaitement accessible.

Les années 50 on vu l’émergence de l’IA : on se pose la question de comment simuler la pensée et le langage, mais aussi comment faire apprendre une machine.

20190427_101458

Qu’est-ce qu’une IA ?

20190427_101546

Une fois qu’on a défini la notion d’IA, on distingue IA faible et IA forte :

  • Une IA faible est capable de résoudre une tâche unique, et le fait très bien : reconnaître un visage, transcrire la parole en texte. Mais la même machine ne peut pas faire les deux.
  • Une IA forte est une IA qui, éventuellement, est capable de jouer au tennis tout en traduisant de l’anglais en malgache. C’est actuellement super difficile.

Actuellement, nous sommes dans des IA faibles.

Nos téléphones, l’analyse de SPAM d’il y a 20 ans, la traduction automatique, des systèmes de recommandations sur des sites marchands, les véhicules autonomes, sont pleins d’IA.

20190427_102327

Le machine learning n’est rien d’autre qu’une partie des statistiques, une réalisation un peu améliorée avec un peu d’informatique.

On essaie de faire apprendre les machines à partir d’exemples : on cherche à ce qu’elle apprenne à reconnaître une entité à partir de certaines de ses caractéristiques, pertinentes. C’est un contexte d’apprentissage supervisé.

On réalise des approximations, par le biais de fonctions :

20190427_103157

La fonction sigma va donner des 0 ou des 1, s’activer ou pas.

Un réseau de neurones contient des millions de neurones. On parle de deep learning car il y a plusieurs couches de neurones artificiels pour obtenir une représentation pertinente des données en entrée.

Si on regarde ce qui se passe un peu plus en détail dans un réseau de neurones, on a tout un ensemble de réseaux de neurones qui s’activent ou s’inhibent en fonction de leurs entrées, et selon les couches de neurones on a des réactions aux contours, ou des textures, ou des formes particulières, des parties d’objets…

20190427_103644

On ne sait pas encore toujours exactement comment cet apprentissage se fait, si j’ai bien tout compris, ce qui est étrange pour mon petit cerveau… On apprend à une machine à faire des choses mais on ignore partiellement comment elle apprend ? Ouhaou…

Ce qui fait la différence aujourd’hui, c’est la puissance des outils de calcul, et le fait qu’on a de plus en plus de données. Il a presque dix ans, on faisait 30% d’erreurs. Avec le deep learning on avait progressé considérablement deux ans plus tard, et aujourd’hui la machine est parfois plus performante que l’homme. Un bémol : la machine doit être entraînée beaucoup plus, la plupart du temps, que l’homme.

Différentes autres applications commencent à émerger, comme l’analyse de mélanomes, la découverte d’exo planètes, etc.

Ce qui fait que ça marche, c’est qu’on a été capable de donner à la machine des données labellisées, qui ont permis à la machine d’apprendre des signaux faibles et des relations. Mais il y a beaucoup d’efforts à faire pour générer ces données étiquetées. Derrière l’IA il y a donc tout un pan caché qui consiste à générer ces données.

Une autre partie du machine learning est l’apprentissage non supervisé : on cherche à générer une partition des données qui soit homogène à partir de données plus hétérogènes.

20190427_104916

C’est que font les sites marchands, mais c’est aussi utile dans le diagnostic médical : pour pouvoir soigner certains types de cancers et bien cibler les tumeurs, on essaie de savoir précisément où sont les muscles par exemple, sans avoir préalablement ciblé telle ou telle région, ce qui est impossible autrement.

20190427_105326

Le troisième paradigme d’apprentissage, c’est l’apprentissage par renforcement. On va apprendre en interagissant.

20190427_105425

Le robot obtient une récompense lorsqu’il réalise une tâche et il va être puni si il fait une erreur. Ce sont des stratégies qui marchent par essais-erreurs. Il faut faire des milliers et des milliers d’essais, mais la machine comprend au final comment elle reçoit des récompenses. Evidemment, il faut définir la notion de récompense.

20190427_110159

On peut faire émerger des stratégies assez inattendues, et parfois au contraire on retrouve des stratégies que nous humains avons essayé de développer.

Ce n’est pas adapté à tout : pour les véhicules autonomes, va-t-on faire se crasher un véhicule un grand nombre de fois pour laisser la machine tâtonner ?

Les réseaux génératifs adverses (GAN) vident à générer des données qui « ressemblent » à des exemples. C’est important pour apprendre à une machine à compléter des données manquantes, par exemple. Quand on apprend à la machine à jouer à un jeu de police et de faussaire, la machine essaie de générer de fausses images, mais il n’est pas très fort. A coté, on fait reconnaître les vraies images des fausses à une autre machine. Au début du coup, le problème est facile. Mais au fur et à mesure, avec une boucle de rétroaction sur la machine faussaire, cette machine faussaire s’améliore. A la fin, la machine est très forte. Pour le moment, il n’y a aucune application : c’est beau les maths :-). D’ailleurs, on ne comprend pas encore bien comment la machine fait pour combiner les images (femme souriante-femme neutre=homme souriant, par exemple), mais ça marche bien et c’est intéressant.

Des questions sociétales se posent. Dans les prochaines années, on peut s’attendre à un changement fort dans les interactions entre l’homme et la machine. La machine va sans doute comprendre de mieux en mieux le langage naturel, comme on le voit avec les outils actuels d’assistants personnalisés, comme Alexa. Des questions morales se posent, par exemple dans les conversations machines-humains, lorsque l’humain ignore qu’il parle en fait à une machine. De même, l’homme est-il prêt à être diagnostiqué à 100% par une machine, et comment organiser la coopération entre l’humain et la machine dans ce cadre ? Idem sur les véhicules autonomes, domaine dans lequel on vise plutôt actuellement des véhicules partiellement autonomes.

Côté créativité, on peut produire des oeuvres, mais ce n’est pas « magique », selon Alain Rakotomamonjy.

20190427_112258.jpg

Un algorithme de machine learning ne se fonde que sur ce qu’on lui donne : on peut donc aussi faire un peu tout et n’importe quoi, comme on l’a vu parfois dans des médias : prédire l’orientation sexuelle en fonction du visage, prédire la criminalité en fonction de photos policières.

20190427_112452.jpg

On cherche donc à réduire les biais, les biais sur les images, les biais de langue. Maintenant, il est facile de transformer la voix d’une personne en la voix d’une autre et la coller sur une vidéo, ce qui génère facilement des fake news. On n’a pas vraiment de solution pour le moment contre cela, mais des projets se montent.

Les algorithmes de machine learning sont gourmands en données. Beaucoup de données cont collectées lors de nos usages quotidiens numériques, dont il faut être conscient si on veut l’éviter : il existe des moyens de se protéger. On peut apprendre à une machine à être intelligente sans pour autant partager : c’est l’apprentissage décentralisé, où on crypte ou on stocke sur son disque dur.

20190427_113145

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s