Supervisé, non supervisé, par renforcement... c'est quoi l'apprentissage d'une IA ?
- Stéphane Guy
- 2 janv.
- 6 min de lecture
Dernière mise à jour : 27 janv.
Pour qu'une IA soit performante, il est nécessaire d'avoir recours à un apprentissage afin de la faire grandir. Il en existe trois grands types pour entraîner une intelligence artificielle. Comprendre comment fonctionne l'apprentissage d'une IA permet de mieux saisir le fonctionnement de ces programmes informatiques, de plus en plus présents dans notre vie. Combien d'apprentissages existent et à quoi servent-ils exactement ? On vous explique tout ça ici.

Apprentissage supervisé : c'est quoi et qu'entend-on par là ?
L'apprentissage supervisé consiste à entraîner une IA avec des données dites étiquetées. Par exemple : on souhaite créer une IA pour reconnaître les légumes de manière automatique dans un supermarché, afin de faciliter la pesée et la recherche du bon type de légume par les clients lors de leurs achats. Pour cela, on va rassembler une grande base de données d'images contenant plusieurs légumes. Ces images vont alors être étiquetées. C'est-à-dire qu'elles vont être décrites et préparées à l'avance par des humains pour dire directement à l'IA à quoi ressemblent une courgette, un poivron, etc. L'intelligence artificielle va donc être entraînée de manière supervisée, sous la surveillance des humains.
Dans quoi peut-on utiliser des IA entraînées avec un apprentissage supervisé ?
Les intelligences artificielles construites avec un apprentissage supervisé peuvent être utilisées dans des tâches de reconnaissance et d'analyse, ou encore de prédiction. Par exemple, une IA de cette catégorie peut être utilisée pour l'analyse de sentiments. En montrant à l'IA via des données étiquetées à quoi ressemblent un sourire, un visage triste, une personne en colère... Elle est ensuite capable d'analyser les expressions faciales des personnes pour savoir dans quel état elles se trouvent.
On peut également citer des domaines plus larges comme l'immobilier. Par exemple, en donnant à une IA des données étiquetées et précises sur un bien immobilier, comme le prix qu'il doit avoir pour une certaine superficie ainsi que d'autres caractéristiques. Une agence immobilière pourrait ensuite avoir sur son site Internet un outil d'estimation de bien immobilier pour les personnes souhaitant mettre en vente leur logement et avoir une estimation rapide et fiable.
Apprentissage non supervisé : c'est quoi et quelle est la différence avec l'apprentissage supervisé ?
L'apprentissage non supervisé, contrairement à l'apprentissage supervisé, se fait sans étiquetage des données envoyées pour former l'IA. Concrètement, l'IA doit apprendre à reconnaître d'elle-même les schémas qui pourraient exister dans des paquets de données afin de détecter plus efficacement de possibles "patterns" et structures anormales. On peut donc dire que l'intelligence artificielle formée via un apprentissage non supervisé est plus intelligente, dans le sens où elle sera plus capable de détecter des anomalies et de trouver des schémas auxquels l'homme n'aurait pas pensé. Elle est cependant moins efficace pour la détection classique contrairement à l'IA avec un apprentissage supervisé.
L'apprentissage non supervisé fonctionne donc par classification et association. L'IA va chercher à classer les données qu'elle a, pour avoir de grandes catégories qui vont ensuite lui permettre d'associer ces données afin de créer des liens et des groupes. Elle va ainsi être en mesure de détecter les schémas et patterns présents dans ces données. Par exemple, si on parle d'une IA utilisée par un journal pour catégoriser les articles, elle va essayer d'associer tous les articles qui parlent d'écologie pour les regrouper.
Dans quoi peut-on utiliser des IA entraînées avec un apprentissage non supervisé ?
On peut supposer qu'une IA entraînée avec un modèle d'apprentissage non supervisé pourrait servir dans le domaine de la finance, pour détecter des fraudes par exemple. En effet, en apprenant les patterns classiques de transactions, placements et virements financiers, l'intelligence artificielle serait à même de détecter des anomalies et irrégularités plus rapidement qu'un humain.
De manière plus concrète, "Google Actualités utilise l'apprentissage non supervisé pour classer les articles traitant d'un même sujet dans différents médias en ligne".* On peut également citer le domaine du marketing, ou l'apprentissage non supervisé va permettre à l'IA de classer et associer certains paramètres et habitudes d'achat pour créer ou mettre à jour des profils d'acheteurs potentiels. L'intelligence artificielle peut donc permettre de détecter de nouveaux profils et de nouvelles opportunités commerciales.
*IBM, qu'est-ce que l'apprentissage non supervisé ?
Apprentissage par renforcement : c'est quoi ?
L'apprentissage par renforcement est là aussi une méthode de machine learning, mais qui va cette fois-ci se concentrer sur la recherche de la meilleure action pour obtenir la performance la plus élevée. Concrètement, les logiciels sont ici entraînés à prendre les meilleures décisions pour obtenir les meilleurs résultats possible. Il s'agit d'un apprentissage proche de celui par tâtonnement. C'est-à-dire que l'IA va essayer plusieurs schémas pour arriver à un objectif, et va analyser lequel est le plus efficace et optimal. Ce système repose sur un jeu de punition et de récompense. Le but étant d'avoir le plus de récompense possible.
Dans quoi peut-on utiliser des IA entraînées avec un apprentissage par renforcement ?
Concrètement, ce type d'intelligence artificielle est idéal pour l'investissement. En effet, dans ce secteur ou les taux et les marchés fluctuent de jour en jour, et même de minute en minute, l'IA entraînée par renforcement va analyser en permanence la méthode la plus efficace d'atteindre son objectif, comme par exemple trouver le meilleur taux pour placer une somme d'argent.
Ce système d'apprentissage permet donc à l'IA d'apprendre de ses erreurs pour se perfectionner et chercher une solution toujours plus efficiente. C'est notamment le cas d'AlphaGo, l'IA de Google qui a battu plusieurs fois le champion du monde de go. En jouant avec lui encore et encore et en effectuant des simulations avec un système de récompense/punition, l'IA s'est perfectionnée au point de devenir imbattable.
Autre exemple : le jeu vidéo ! On peut tout à fait imaginer une IA capable de s'adapter au comportement du joueur au fur et à mesure de son aventure et de sa progression. C'est en partie le cas dans le jeu vidéo Alien Isolation, où l'intelligence artificielle créée pour l'alien va s'adapter au style de jeu du ou de la joueuse, et chercher à interférer avec sa progression. L'IA utilisée pour l'alien est divisée en deux parties : une IA qui connaît en permanence la position et le statut exact du joueur sur la carte, et une seconde IA qui va chercher le joueur dans la zone "globale" du joueur pour le trouver en réagissant aux bruits et autres interactions dudit joueur dans le jeu. Si la première IA n'est jamais autorisée à partager la position du joueur à la deuxième pour des raisons évidentes de tricherie, d'immersion et de gameplay, la seconde doit donc le retrouver avec des informations approximatives. Ensuite, l'intelligence artificielle de l'alien agit également grâce à une jauge qui détermine le taux de stress potentiel du joueur. Cette jauge utilise des paramètres comme le temps passé à proximité du joueur, la distance entre l'alien et lui, etc. Une fois la jauge trop haute, l'IA va faire fuir l'alien pour permettre au joueur de progresser dans le jeu et ne pas être en état de tension permanente, ce qui nuirait à son expérience vidéoludique.*
*Youtube, AI and games ; The AI of Alien: Isolation | AI and Games #15
Ici, l'IA de l'alien s'adapte donc à la situation du joueur, sa position, son avancement dans l'histoire ou sa proximité. Bien qu'il ne s'agisse pas à proprement parler d'une IA avec un entraînement par renforcement, son schéma de fonctionnement s'y rapproche et laisse entrevoir des possibilités très intéressantes dans ce secteur, qui emploie massivement des programmes d'IA pour gérer les personnages non joueurs, les événements, etc.
Quelles perspectives pour l'apprentissage IA ?
Une fois tout cela dit, que conclure et que penser du futur de l'apprentissage des IA, si ce n'est que le plus excitant est encore à venir ? On peut imaginer désormais des intelligences artificielles avec des modèles d'apprentissages hybrides, capables de combiner plusieurs techniques pour devenir plus polyvalentes et encore plus performantes. D'un autre côté, nous sommes encore loin d'avoir atteint le plein potentiel de ces trois apprentissages, et les progrès de l'IA sont encore à faire. Au fur et à mesure qu'elle deviendra plus efficace, de plus en plus de secteurs d'activité pourront se servir d'elle.
Bình luận