Apprentissage machine supervisé opposé à non supervisé
Valérie Bécaert Valérie Bécaert
11 octobre 7 min

Apprentissage machine supervisé opposé à non supervisé

Dans le domaine de l’intelligence artificielle (IA), il existe de nombreuses approches de l’apprentissage machine (AM). Celles-ci peuvent être divisées en plusieurs sous-catégories, dont deux sont : l’apprentissage machine supervisé et l’apprentissage machine non supervisé. Examinons la différence entre les deux, ainsi que ce qui fait que chacune d’elles convient le mieux à des tâches et à des cas d’application particuliers.

Apprendre avec des exemples

Tous les types d’apprentissage machine analysent les données, en tirent des enseignements et utilisent ces connaissances pour prendre de meilleures décisions ou des décisions mieux informées. Ce qui distingue l’apprentissage machine supervisé, comme son nom l’indique, c’est qu’il a besoin d’être guidé dans son processus d’apprentissage. Bref, il faut lui enseigner.

Cette supervision se fait en utilisant des données structurées. Les scientifiques utilisent ces données, qui ont été étiquetées, pour enseigner à l’algorithme. Imaginez que, chaque fois que l’algorithme d’IA analyse un point de données, c’est comme une question dans un examen, avec une bonne ou une mauvaise réponse.

Par exemple, un scientifique peut entraîner un algorithme pour une tâche de reconnaissance d’images qui est de décider si une série d’images représente des oranges. Le superviseur aura déjà étiqueté les données de formation avec les bonnes réponses, ce qui permettra à l’algorithme de voir l’image d’une orange et d’apprendre ses caractéristiques fondamentales : par exemple, sa forme ronde et sa couleur orange.

Une fois que l’IA a été formée à l’aide de ces données, elle peut prendre ses propres décisions avec de nouvelles données non étiquetées qu’elle n’a jamais vu avant. Si au lieu de l’image d’une orange, elle reçoit l’image d’une banane en entrée, elle ne retrouvera pas les caractéristiques qu’elle a été entraînée à voir et conclura que ce n’est pas une orange.

Apprentissage machine supervisé en action

L’apprentissage supervisé a de nombreuses applications et est beaucoup plus souvent utilisé que l’apprentissage non supervisé. Un bon exemple d’apprentissage supervisé est la traduction automatique à l’aide de l’IA.

Premièrement, les scientifiques forment le modèle d’IA à partir de données tirées de livres et de textes existants qui ont été traduits. Cela fournit les connexions préexistantes entre les différentes langues. Ensuite, après avoir atteint un certain seuil de précision, le modèle peut être utilisé pour traduire un texte qu’il n’a jamais vu auparavant.

L’apprentissage supervisé n’est pas limité aux tâches de classification mais peut aussi s’appliquer à des tâche de régression et de prédiction de structure; c’est-à-dire des tâches impliquant des informations qui sont présentées sur un spectre continu plutôt que sur une série de points fixes. Ces types de données sont très souvent collectées par des capteurs d’Internet des objets.

La régression est utile pour la prédiction d’une valeur ou un facteur dans un système, comme le cours d’une action ou le poids d’un article, tout en tenant compte d’un ensemble d’autres valeurs. Les fabricants, par exemple, peuvent utiliser la régression alimentée par l’IA pour prédire la durée de vie des machines de production, en utilisant les nombreux points de données fournis par la machine. Ils peuvent anticiper les pannes de composants ou de machines et planifier la maintenance ou le remplacement des pièces, évitant ainsi des temps d’arrêt coûteux en cas de panne imprévue.

L’un des principaux défis de l’apprentissage supervisé est qu’il repose sur des ensembles de données préexistants. Dans certains cas, ces données ne seront pas disponibles, trop coûteuses à obtenir ou la difficulté de les étiqueter dépasse la capacité d’une personne ou d’un groupe de personnes. Dans d’autres cas, c’est l’étiquetage lui-même qui est ce que nous voulons que le modèle d’IA fasse. Par exemple, sélectionner et organiser les photos d’oiseaux dans chaque photo sur Internet.

La machine autodidacte

L’apprentissage machine non supervisé n’a pas besoin d’exemples pour apprendre. Il prend des données non structurées (non étiquetées) et fait des découvertes qui peuvent être utilisées pour former des jugements plus larges, généralement par regroupement et association. L’idée familière de l’intelligence artificielle, de machines capables d’analyser et d’interpréter toute nouvelle donnée qu’elles rencontrent, est la plus proche de l’apprentissage non supervisé, même si nous sommes à des années de cela.

Cela rend l’apprentissage machine non supervisé parfait pour les types de tâches d’analyse de données qui ne cherchent pas la bonne réponse à une question, comme « banane ou orange? ». Au lieu de cela, ils recherchent des modèles et des anomalies utiles dans les données. Ces connaissances peuvent déboucher sur des optimisation commerciale et des innovations qui ne sont pas disponibles par d’autres méthodes.

Applications d’AM non supervisées

L’industrie de l’assurance est axée sur la gestion des risques. Des techniques telles que le clustering (regroupement et tri des données brutes), la détection des anomalies et l’exploration des associations sont utilisées en assurance pour découvrir des connexions inattendues et minimiser les risques en regroupant les données démographiques. La détection des anomalies peut aider à identifier les valeurs aberrantes et les cas possibles de fraude.

Un autre exemple est celui des détaillants, qui peuvent utiliser l’apprentissage machine non supervisé pour améliorer leur segmentation de la clientèle, découvrant ainsi des tendances dans les données sur les achats des clients, qui peuvent être utilisées pour affiner leurs efforts de marketing et même leurs modèles commerciaux. Au fur et à mesure que la quantité et la profondeur des données disponibles augmentent, le type de connaissances que l’apprentissage machine peut apporter ne fera que croître.

Bien que l’apprentissage non supervisé puisse être très puissant, il présente de nombreux inconvénients. À l’heure actuelle, il a besoin de beaucoup de puissance de calcul, et ses découvertes ne sont pas toujours utiles. Il peut fournir des corrélations et des modèles fallacieux dans les données tout aussi facilement qu’il peut fournir des idées novatrices. Pour de nombreuses applications, le focus étroit et ciblé de l’apprentissage supervisé permets d’obtenir des résultats plus intéressants et payants.

Trouver la bonne technologie pour vos besoins

Vous pensez peut-être que votre entreprise pourrait tirer profit d’un apprentissage machine supervisé ou bien plutôt qu’un apprentissage non supervisé serait la voie à suivre – ou une combinaison des deux. L’intelligence artificielle progresse rapidement, peut-être que ces termes seront remplacés à mesure que nous apprendrons à développer de nouveaux et plus performant modèles d’intelligence artificielle. Vous pouvez en apprendre davantage sur tout ce qui touche à l’IA ici.