Les différentes catégories de Machine Learning et leur fonctionnement

Technique de programmation informatique, le Machine Learning utilise les probabilités statistiques afin de permettre aux ordinateurs d’apprendre par eux-mêmes, sans que cela ne passe par une programmation explicite. Pour être plus clair, l’idée est de faire en sorte que les ordinateurs agissent et réagissent sans qu’ils aient été programmés explicitement au préalable. Le Machine Learning peut être mis en pratique dans plusieurs domaines. Il en existe principalement 3 catégories, chacune ayant ses particularités.

Le Machine Learning avec supervision

Les entrées et les sorties

Quoique élémentaire, le Machine Learning avec supervision est assez strict. Dans cette catégorie, des exemples d’entrées sont présentés à l’ordinateur par les opérateurs, de même que les sorties souhaitées. L’ordinateur recherche ensuite des solutions permettant d’obtenir ces sorties en fonction des entrées. Par cette façon de faire, on veut que l’ordinateur soit capable d’apprendre la règle générale qui fait correspondre les entrées aux sorties.

Modélisation prédictive

L’utilisation du Machine Learning avec supervision est envisageable pour réaliser des prédictions sur des données indisponibles ou futures, ce qu’on appelle « modélisation prédictive ». L’algorithme exploité essaie de mettre au point une fonction prédisant avec précision la sortie à partir des variables d’entrée.

Classification et régression

Notez qu’il est possible de subdiviser le Machine Learning avec supervision en deux types : la classification (où la variable de sortie est une catégorie) et la régression (où la variable de sortie est une valeur spécifique). Si vous cliquez pour tout savoir sur le Machine Learning, vous saurez que cette technologie fonctionne avec des algorithmes. Concernant le Machine Learning avec supervision, les algorithmes les plus utilisés sont les suivants : les forêts aléatoires, la régression linéaire, les arbres décisionnels, la méthode du k plus proche voisin (k-NN), la machine à vecteurs de support (SVM), la classification naïve bayésienne et le boosting des gradients.

Le Machine Learning sans supervision

Apprentissage des caractéristiques

Dans la catégorie du Machine Learning sans supervision, l’algorithme utilisé est “livré” à lui-même afin de déterminer la structure de l’entrée. On peut considérer cette approche comme un but en soit, en ce sens qu’il permet de découvrir des structures enfouies dans les données. Il est possible aussi de la percevoir comme un moyen d’atteindre un certain but. Notez que cette approche est également appelée « apprentissage des caractéristiques » ou feature learning.

Exemple d’algorithme sans supervision

L’algorithme de reconnaissance faciale prédictive de Facebook est un exemple de Machine Learning sans supervision. Il permet d’identifier les personnes sur les photos mises en ligne par les utilisateurs.

Clustering et association

On distingue deux types de Machine Learning sans supervision. Le premier est le clustering dont l’objectif consiste à trouver des regroupements dans les données. Et le deuxième est l’association qui vise à identifier les règles permettant de définir de grands groupes de données.

Les algorithmes sans supervision

Divers algorithmes sont utilisés pour faire du Machine Learning sans supervision. On peut citer en exemple l’algorithme K-Means qui s’appuie sur une méthode itérative afin de trier des points de données en groupés basés sur des caractéristiques similaires. Il y a aussi l’algorithme Apriori dont on se sert pour chercher les affinités entre deux éléments d’un jeu de données, le but étant de voir s’il y a une corrélation négative ou positive entre eux. Il est très utilisé par les équipes commerciales qui ont tendance à enquêter pour savoir quels produits vont intéresser un client.

Le Machine Learning par renforcement

La troisième catégorie de Machine Learning est celle par renforcement. Dans le cadre de sa mise en œuvre, un programme informatique est en interaction avec un environnement dynamique au sein duquel il doit atteindre un certain but. Conduire un véhicule ou affronter un adversaire dans un jeu en sont des exemples. Du feedback est reçu par le programme-apprenti sous la forme de « récompenses » ou de « punitions » pendant qu’il sillonne l’espace du problème et travaille pour identifier l’attitude la plus performante dans le contexte concerné. On se souvient qu’en 2013, un algorithme de Machine Learning par renforcement, à savoir Q-learning, a appris comment gagner dans 6 jeux vidéo Atari sans aucune intervention d’un programmeur, et s’était ainsi rendu célèbre.

Les types de Machine Learning par renforcement

On distingue deux types de Machine Learning par renforcement. Le premier est Monte Carlo où des récompenses sont reçues par le programme à la fin de l’état « terminal ». Le deuxième est le Machine Learning par différence temporelle (TD) dans lequel des récompenses sont évaluées et accordées à chaque étape.

Les algorithmes par renforcement

Plusieurs algorithmes sont utilisés pour faire du Machine Learning par renforcement. C’est le cas de Q-learning, cité plus haut, qui s’emploie à trouver la meilleure méthode afin d’atteindre un objectif défini en cherchant à obtenir le maximum de récompenses. Deep Q Network (DQN) et SARSA (State-Action-Reward-State-Action) sont d’autres algorithmes couramment utilisés dans le domaine du Machine Learning par renforcement.