L’exploration de données et l’apprentissage machine
Valérie Bécaert Valérie Bécaert
26 novembre 6 min

L’exploration de données et l’apprentissage machine

L’intelligence artificielle (IA) et le domaine plus vaste de la science des données évoluent rapidement, et les frontières sont souvent floues entre les différentes technologies et les termes employés pour les décrire. Les méthodes et les applications d’un bon nombre de ces technologies se chevauchent, et certaines sont des sous-ensembles d’idées plus générales. L’exploration de données et l’apprentissage machine sont deux termes parfois utilisés de façon interchangeable, mais ces concepts présentent de grandes différences qu’il est important de comprendre.

Explorer pour trouver un sens

L’exploration de données est le terme général qui désigne la découverte de tendances cachées dans de grands ensembles de données, à l’aide de méthodes qui comprennent l’apprentissage machine. Les approches utilisées comprennent l’analyse de groupement, qui consiste à regrouper automatiquement les éléments d’un ensemble de données en fonction de propriétés communes, ainsi que la détection d’anomalies et d’autres techniques de corrélation. L’exploration de données consiste également à analyser les relations entre de nombreuses variables et constantes parmi les données, afin de faire des prédictions. Elle est souvent confondue avec l’analyse de données, qui est utilisée pour tester des modèles et des hypothèses sur l’ensemble de données.

En tenant compte de tout ce qui précède, vous pouvez très bien conclure que le terme exploration de données lui-même est mal choisi. Après tout, l’exploration géographique, par exemple, se réfère au territoire exploré, et non à l’endroit où se fait l’exploration. Le même principe s’applique pour l’exploration de données : ce ne sont pas les données qui sont explorées, mais le sens qui est extrait des données. On pourrait donc parler d’exploration des connaissances, ou du sens.

C’est pourquoi l’exploration de données est parfois aussi connue sous le nom de découverte de connaissances. Il s’agit littéralement de chercher une aiguille de connaissance dans la botte de foin d’un énorme ensemble de données – une tâche parfaite à confier à un ordinateur rapide, précis et infatigable.

Apprendre et s’améliorer

Les techniques d’exploration de données recherchent des tendances dans les données, les analysent et en extraient des connaissances. Avant l’avènement de l’intelligence artificielle, des approches logicielles classiques étaient utilisées : il fallait indiquer exactement au programme ce qu’il fallait faire et ce que l’on cherchait.

L’apprentissage machine traite elle aussi des données, mais d’une manière fondamentalement différente. Il s’agit d’un sous-ensemble des technologies d’intelligence artificielle qui permet aux systèmes d’analyser l’information et d’en tirer des conclusions. Jusque-là, rien de bien nouveau. Mais ce qui rend l’apprentissage machine unique, c’est sa capacité de prendre des décisions, d’en tirer des leçons et de mettre en pratique ces leçons pour améliorer les décisions prises.

Pour acquérir un niveau de compréhension plus approfondi ou classer avec précision de grandes quantités de données, des modèles d’apprentissage machine supervisés ou semi-supervisés sont entraînés à l’aide de données sélectionnées et étiquetées, afin que la machine puisse savoir ce qu’elle doit chercher. Un modèle d’IA peut apprendre à discerner certaines caractéristiques déterminantes dans les données d’apprentissage et à établir un cadre de référence qui lui servira à traiter les données ultérieures.

Cette expertise, acquise par l’expérience, améliore les modèles d’apprentissage machine, qui deviennent plus précis et plus efficaces en utilisant les connaissances qu’ils accumulent quand ils analysent des données ou effectuent une tâche. Une fois entraînés, ils peuvent travailler avec des données non structurées, car ils reconnaissent alors les caractéristiques pertinentes sans nécessiter un étiquetage préalable.

À la recherche de tendances

L’exploration de données est beaucoup utilisée, notamment, dans le domaine de l’assurance, où l’on peut cerner des tendances dans de grandes quantités de réclamations. Cela permet aux compagnies d’assurance d’adapter en conséquence les conditions de leur couverture et leurs primes.

Un sous-ensemble de l’exploration de données, l’exploration de texte, est souvent utilisé à cette fin. Dans sa forme la plus simple, il s’agit d’une recherche par mot-clé, comparable à la commande Rechercher dans une application. Mais aujourd’hui, l’exploration de texte peut utiliser la logique de la décision et le traitement des langues naturelles pour établir des relations entre les éléments de données – par exemple, l’emplacement et l’âge des clients. Cette exploration de texte perfectionnée peut même analyser certains sentiments des clients, comme l’insatisfaction, ce qui permet à l’assureur de planifier des polices et des services mieux adaptés à leurs besoins.

Par exemple, si de nombreux clients de moins de 20 ans parlent négativement du prix de leur assurance automobile, l’exploration de texte le découvrira, et la compagnie d’assurance pourra fixer des primes plus abordables pour les jeunes clients; ceux-ci seront alors moins susceptibles de satisfaire ailleurs leurs besoins en assurance. Ce n’est là qu’un exemple parmi d’autres du type de connaissances que l’exploration de données peut fournir, et des avantages qu’elle offre aux entreprises.

Comprendre le passé et l’avenir du marché

Les services financiers ont rapidement profité de l’apprentissage machine. Une étude réalisée en 2019 par Refinitiv (anciennement Thomson Reuters) a révélé que 90 % des répondants avaient déjà mis en œuvre l’apprentissage machine au sein de leur entreprise. De plus, 78 % d’entre eux ont déclaré que l’apprentissage machine était une composante essentielle de leur stratégie d’entreprise. Le rapport indiquait également que l’apprentissage machine deviendrait le meilleur moyen d’obtenir un avantage concurrentiel dans le secteur des services financiers.

Les entreprises financières sont impatientes de profiter au maximum des capacités de l’apprentissage machine pour analyser les conditions actuelles du marché et tirer des leçons des données historiques afin d’obtenir des connaissances utiles sur les opérations, d’évaluer le rendement et de cerner les risques potentiels. Ce secteur a toujours adopté rapidement les nouvelles technologies, du boulier compteur aux premiers systèmes de transaction automatisés, et maintenant aux innovations axées sur l’IA.

Toujours plus en profondeur

Avec l’apparition de formes encore plus avancées d’apprentissage machine, comme l’apprentissage profond, les techniques d’exploration de données sont maintenant en mesure d’atteindre des niveaux sans précédent de connaissances et de précision, et peuvent être utilisées pour des applications jusque-là insoupçonnées. Quelle découverte révolutionnaire permettront-elles bientôt?