Les machines peuvent-elles apprendre comme les humains ou qu'est-ce que l'apprentissage machine ?

Imprimer

Les machines peuvent-elles apprendre comme les humains ou qu'est-ce que l'apprentissage machine ?

Définition de l’apprentissage machine

Reportons-nous aux définitions du Massachusetts Institute of Technology de Boston ^[1]

( référence utilisée par l’Organisation Mondiale de la Santé) ^[2].

Définition du MIT.

« Les algorithmes d’apprentissage-machine utilisent les statistiques pour retrouver des motifs au sein de quantités massives de données. Les données englobent beaucoup de choses - nombres, mots, images, clicks, etc… Tout ce qui peut être stocké numériquement peut alimenter un algorithme d’apprentissage machine ». [1]

Définition de Daniela Rus, professeur d’informatique et intelligence artificielle au MIT.

« L’apprentissage machine est un processus qui part d’un corps de données et ensuite essaie de déduire des règles ou des procédures qui soit expliquent les données, soit prédisent de futures données».[3]

Quelques explications complémentaires

L’informatique utilise une information écrite en langage binaire. Une donnée numérisée ( on dit aussi digitale, qui est un synonyme) est une information codée en mode binaire.

Le langage binaire est un code qui ne comprend que 2 symboles, les chiffres zéro et un. Ainsi, toute information entrant dans un ordinateur se présente sous la forme d’une succession de 0 et de 1. Cette même succession de 0 et de 1 dessine des motifs au sein de la base de données. Par exemple, le chiffre 2 en binaire s'écrit 10 (lire "un, zéro" et non "dix"). L'élément "10" est le motif du chiffre 2 que l'on retrouvera partout où l'on aura écrit "2" dans la base de données.

L'apprentissage machine, et plus largement l'intelligence artificielle, c'est fabriquer un algorithme informatique capable de reconnaître des motifs au sein de cette succession de 0 et de 1. Le terme de motifs doit être compris exactement dans le même sens que ceux d'un dessin ou d'une broderie, c’est-à-dire des éléments qui se répètent et se ressemblent.

Lorsque les mêmes motifs se retrouvent dans des jeux de données différents, on peut les classer dans la même catégorie. Par exemple, si on veut reconnaître des reins sur des images de scanner, l’ordinateur va repérer la répétition de la même forme approximative en haricot caractéristique du rein. La forme en haricot est un motif. Toutes les images pour lesquelles ce motif aura été repéré seront classées dans la même catégorie.

L’ordinateur « apprend » donc à distinguer des motifs au sein des données, puis, en recherchant l’existence de ce motif dans d’autres jeux de données les classe comme appartenant à la même catégorie.

Il s’agit donc de savoir si les motifs repérés sont liés entre eux par une relation quelconque. Pour ceci, on réalise des calculs statistiques, raison pour laquelle le MIT résume la définition de l’intelligence artificielle à la réalisation de statistiques.

Les 3 types d’apprentissage machine

Le MIT distingue 3 types d’apprentissage machine : l’apprentissage supervisé, l’apprentissage non supervisé, l’apprentissage par renforcement. Chacun est défini de la façon suivante.

Apprentissage supervisé.

« Les données sont étiquetées pour dire à la machine quels motifs exactement elle doit rechercher. C’est ce que vous faites sur Netflix quand vous appuyez sur « play » pour démarrer une série : vous dites à l’algorithme de rechercher des séries similaires. »

Apprentissage non supervisé.

« Dans l’apprentissage non supervisé, les données n’ont pas de label. La machine recherche simplement tous les motifs qu’elle peut retrouver. C’est comme laisser un chien sentir des tonnes d’objets différents et les trier en groupes d’odeurs similaires ».

Apprentissage par renforcement.

« Un algorithme d’apprentissage par renforcement apprend par essais et erreurs pour atteindre un objectif clair. Il essaye plein de choses différentes et est pénalisé ou récompensé selon que ses comportements l’aident ou l’empêchent d’atteindre son objectif. C’est comme donner et retenir des friandises lorsque l’on enseigne un nouveau tour à un chien. L’apprentissage par renforcement est la base d’Alphago de Google, le programme qui a battu les meilleurs joueurs humains au jeu de go ».

Quelques explications complémentaires

L’essentiel de l’intelligence artificielle, et particulièrement en médecine, est de l’intelligence artificielle supervisée. On emploie ce terme car la machine ne découvre pas les choses par elle-même, elle « apprend » à partir de données dites étiquetées. De quoi s’agit-il ?

Prenons l’exemple d’un système que l’on souhaite programmer pour reconnaître des chats sur des photographies. Pour cela, on va utiliser une base de données composée de milliers de photos de chats préalablement marquées comme étant des chats. On oriente donc la machine vers ce qu’elle doit rechercher. Pour effectuer une comparaison simple, nous sommes dans la situation de l’imagier des enfants où chaque image porte un titre avec l’animal représenté: la poule, le chien etc..

Dans l’apprentissage non supervisé, l’algorithme essaie d’identifier des éléments communs pour séparer les données en groupes. Reprenons l’exemple de la forme du rein. En apprentissage supervisé, l’algorithme dispose de formes de référence (les images labellisées) et doit comparer la forme des images qu’on lui donne. Il recherche si statistiquement, les nouvelles images ressemblent à celles qu’il connaît. Dans l’apprentissage non supervisé, il n’y a pas d’image de référence. L’algorithme repère dans l’arrangement des données des motifs qui se ressemblent (par exemple la forme du rein qui se retrouve approximativement être la même sur les différentes images) et regroupe toutes les images correspondantes dans la même classe. Au final, il aura donc identifié un lien entre des groupes de données. Cette méthode est utile pour analyser et comprendre une base de données.

L’apprentissage renforcé, quant à lui, est une technique adaptée à la prise de décision. C'est le cas des jeux. Face à une situation, l’algorithme prend une décision (avancer un pion par exemple). Dans tous les cas, on donne à la machine le résultat de son action: gagnant ou perdant). Par la suite, à chaque nouvelle situation, l’algorithme recherche dans sa mémoire s’il a déjà été confronté à la même chose. Si oui, la machine agit en fonction. Par exemple, si précédemment, elle a perdu, l'algorithme essaie une autre solution. A nouveau, on indique à la machine si l'algorithme a eu raison ou tort. Et ainsi de suite, jusqu’à obtenir une IA capable de prendre à chaque fois la bonne décision.

Les machines apprennent-elles ou peuvent-elles apprendre comme les humains?

« Les machines nous dépasseront car elles sont plus performantes que le cerveau humain ».

Cette petite phrase a envahi le débat public et, avec toute la force invincible des idées reçues, a fini par convaincre la majorité. Mais qu’en est-il vraiment? Existe-t-il une réelle justification scientifique à une telle affirmation ?

Essayons de nous orienter à partir de quelques pistes de réflexion.

Apprentissage et intelligence sont intimement liés. Pas d’intelligence sans apprentissage.

En première lecture, on peut donc se dire que si les machines obtenaient, un jour prochain, la capacité d'apprendre comme les humains, elles pourraient nous surpasser. L’argumentation repose sur une comparaison de performance entre ordinateur et cerveau humain. Dans cette idée, la victoire au jeu de Go est avancée comme un événement fondateur. Mais l’intelligence est-elle une simple affaire de vitesse de calcul et d’efficacité de réseaux de neurones dans des tâches précises?

Pour trouver des éléments de réponse, laissons de côté un instant le strict cadre de l’informatique et de la neurobiologie et tournons notre regard vers d’autres sciences, qui, elles aussi, se penchent sur l’intelligence humaine: la psychologie et la paléo-anthropologie.

L’une, la psychologie nous apprend de quelle manière nos comportements et nos décisions sont le fait de nos interactions avec les autres. La seconde, la paléo-anthropologie, nous montre que l’évolution humaine est un processus bio-culturel qui a progressivement émergé, sur des centaines de milliers d’années, à partir du langage, de la technologie et de la complexité sociale.

Dans le fond, toutes les 2 nous disent la même chose. C’est en faisant société, en s’associant les uns aux autres, que les système nerveux centraux des humains ont produit l’intelligence.

Ainsi, si elle est bien produite par le cerveau et ses neurones, l'intelligence humaine est en réalité collective.

Dès lors, il faut s'interroger. Les machines peuvent-elles apprendre comme les humains et développer une intelligence autonome sans faire société ? Inversement, si l’on se dit qu’intelligence et complexité sociale sont liées, comment les machines peuvent-elles faire société? Et quel intérêt pour elles? Car n’oublions pas que, dans le vivant, l’association des individus remplit une fonction en favorisant la survie de l’espèce et l'adaptation au milieu environnant.

Est-il donc réellement crédible de parler d'intelligence autonome des machines sans se poser ces questions fondamentales?

Mais laissons-là ces interrogations et retournons à l’informatique et à la comparaison ordinateur-cerveau.

Les humains, tout comme les animaux apprennent à partir des sensations transmises au cerveau par le système nerveux sensitif. Si l’on veut utiliser une image informatique, nous pouvons dire que les « données » entrantes du cerveau proviennent du monde environnant. Notre « base de données » est le monde réel, tel qu’il est, tout au moins tel qu’il apparaît à nos sens. Ces derniers alimentent le cerveau en permanence.

La position de l’ordinateur est bien différente. Son « monde » n’est pas le monde réel. Il est celui des documents produits par l’activité humaine, et encore pas tous, uniquement ceux qui ont été numérisés. Par son origine et sa composition, le « monde des ordinateurs » n’est qu’un reflet restreint et déformé de la réalité.

Nous pouvons le comparer à une bibliothèque. Comme toute bibliothèque, elle contient des documents de valeur très inégale: certains sont des documents scientifiques sérieux et exacts, d’autres sont anciens et obsolètes, d’autres encore sont des inventions (romans, histoires humoristiques…).

Pour conclure

L’intelligence et la conscience humaines sont des fonctions biologiques, nées de l’évolution du vivant et du système nerveux puis de la vie collective d'homo sapiens. Notre système nerveux nous intègre à notre environnement et nous permet de prendre connaissance du monde réel. C’est lui qui fournit les sensations à la base de notre apprentissage.

Il n’est pas suffisant de comparer la vitesse de calcul des ordinateurs avec le délai de réponse du cerveau dans des tâches ciblées pour proclamer que les machines ont pris le chemin de l’intelligence autonome. Ce point de vue présente de nombreuses incohérences en occultant des traits essentiels de l’intelligence humaine complètement inaccessibles aux ordinateurs (caractère collectif, alimentation du cerveau par le système nerveux sensitif connecté au monde réel).

L’apprentissage-machine est une avancée technique réelle qui démultiplie les capacités de nos ordinateurs et nous donne chaque année de nouveaux appareils qui, au sens propre révolutionnent notre quotidien. Mais les machines n’en deviennent ni conscientes, ni intelligentes autonomes pour autant.

Le terme d’apprentissage machine doit être entendu comme une métaphore. Il n’est pas gênant de l’utiliser, dès l’instant où l’on sait ce que l’on y met, à savoir un terme informatique et que l’on ne fasse pas de comparaison inadaptée avec le cerveau humain.

Bibliographie

[1] Karen Hao, What is machine learning ? MIT Technology Review, 17 nov 2018

[2] Ethics and governance of artificial intelligence for health - Organisation Mondiale de la Santé- juin 2021

[3] Daniela Rus. AI, a vector for positive change in medicine. In Santé et intelligence artificielle. Sous la direction de Bernard Nordlinger et Cédric Villani. CNRS Editions, Paris, 2018.

Références

Sur l'intelligence humaine, 2 références qui ont inspiré ma réflexion:

Olivier Houde. L'intelligence artificielle n'est pas un algorithme. Paris, Odile Jacob. 2019

Les cours de Jean-Jacques Hublin, titulaire de la chaire de paléo-anthropologie du Collège de France.

Lien vers la leçon inaugurale

29/11/2021

1 J'aime 0 Poster un commentaire

Retour aux articles de la catégorie Le lexique de l’IA -

⨯

Inscrivez-vous au site

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 23 autres membres

Les machines peuvent-elles apprendre comme les humains ou qu'est-ce que l'apprentissage machine ?

Membres qui aiment ce contenu

Inscrivez-vous au site