L’industrie 4.0 et l’arrivée de l’intelligence artificielle avec des robots autoapprenant
Après avoir connu déjà 3 révolutions - la mécanisation, avec l’invention de la machine à vapeur, l’exploitation du gaz et du pétrole et de l’électricité et l’avènement de l’électronique - l’industrie connait de nouveau une grande mutation apportée par le développement de l’informatique et des systèmes de communication. Cette nouvelle révolution, baptisée “Industrie 4.0” ou encore “Industrie du Future”, se caractérise par la numérisation de l’information et de l’interconnectivité des appareils mobiles connectés. Ces appareils permettent de traiter et d'exploiter énormément de données numériques de nature différentes. Aujourd’hui , nos usines peuvent en effet s’appuyer sur des technologies comme l’IoT (l’Internet des Objets), la big data, la réalité virtuelle, la 5G, les robots, etc. Il existe une révolution dans cette révolution avec l’Intelligence Artificielle qui permet de pousser encore plus loin les capacités des machines et des robots : ces derniers sont maintenant capables de s’améliorer sans forcément nécessiter une intervention humaine.
IA, un apprentissage par renforcement
L’apprentissage par renforcement est le processus humain d’acquisitions de connaissance, comme lorsqu’on commence à marcher ou à compter. En effet, c’est par l’expérimentation d’actions et des résultats qui en découlent que l’Homme est en mesure de mieux gérer la prochaine fois qu’il se retrouvera dans une situation similaire.
Ce type d’apprentissage peut aujourd’hui être modélisé et reproduit artificiellement pour des cas d’usages très spécifiques. Il s’agit du domaine de l’Intelligence Artificielle appelé apprentissage par renforcement qui est un sous-domaine du Machine Learning (apprentissage automatique).
Lorsque cette capacité est greffée à un robot, nous parlons alors de robots autoapprenants.
Cette IA permet donc à un robot de s’adapter de manière autonome pour atteindre un comportement optimal dans les tâches qui lui sont attribuées, même si ce dernier rencontre une situation pour laquelle il n’avait pas été programmé au départ. Pour se faire, les robots interagissent avec leur environnement et reçoivent un retour sur la performance de leur action par l’intermédiaire d’un modèle informatique complexe mesurant l’écart qu’il y a avec l’objectif initial qui lui était demandé. C’est grâce à cette boucle de rétroaction que le robot s’améliore, en modifiant dynamiquement des paramètres qui permettent d’ajuster le comportement du robot.
Lire notre article « Digitalisation de la Supply Chain : Les robots au service de l’industrie 4.0 »
Un robot auto-apprenant, explication de son fonctionnement
Afin de rendre plus explicite les capacités de ce nouveau type de robot, nous pouvons prendre le cas d’un bras robotique qui a pour mission de récupérer des objets sur un tapis afin de le positionner dans le bac.
Dans le but de pouvoir attraper les objets, le bras se termine par une pince, modélisée par deux morceaux de métal parallèles pouvant se rapprocher ou s’éloigner l’un de l’autre mais aussi pouvant pivoter de façon horizontale. Grace à une capture vidéo faite au niveau du tapis, à l’endroit où le bras doit récupérer les objets, le robot va être en mesure de déterminer l’ouverture et la rotation nécessaire pour capter l’objet. Si le robot est entrainé avant d’être livré pour être en mesure dès le début de récupérer un grand nombre d’objets, il peut s’avérer que de nouvelles pièces soient mises à disposition sur le tapis ou encore que des pièces arrivent endommagées et donc dans des positions non connues du bras robotique.
L’implémentation d’une intelligence d’apprentissage par renforcement va permettre au robot de savoir récupérer ces objets sans nécessiter un retour à l’usine pour une reprogrammation. Dans le cas de ce bras robotisé, la mesure de la performance est relativement simple à comprendre : elle correspond au succès ou au non saisissement de l’objet par le bras. Elle peut être complétée, lorsque l’objet est bien récupéré, par la mesure des écarts existants entre la pince du bras et les différentes parties saisies de l’objet afin d’optimiser au maximum le contact et donc l’adhérence.
Lire notre article « Traçabilité en transport et logistique : Comment l’IA dope la qualité de service ? »
Cas d’usage traités par les robots auto-apprenant
L’utilisation de l’apprentissage par renforcement dans la robotique peut permettre d’adresser de nombreux besoins ou type d’usage. Cela peut être d’améliorer son déplacement en trouvant l’adhérence optimale sur un sol en vinyle lorsqu’il est habituellement utilisé pour se déplacer sur du béton. Cela peut aussi lui permettre de la même façon de s’adapter à des conditions de revêtement de sol qui peut être sec ou humide. Dans ce même ordre d’idée, une équipe de chercheurs de l’université d’Oslo a développé un prototype de robot quadrupède auto-apprenant appelé DyRET qui a la particularité d’adapter sa morphologie en fonction du terrain.
Pour les cas d’usage permettant d’apporter une aide plus directe à une entreprise, les robots autoapprenants se voient de plus en plus utilisés pour des problématiques de rangement ou de classification en s’appuyant sur des contraintes bien déterminées (un volume, une taille, etc.). Ainsi, des solutions ont été développées pour optimiser le montage d’une palette en optimisant la position des articles sur cette dernière. Dans la même idée, le remplissage d’une remorque de camion ou d’un contenant peut être traité automatiquement en prenant en compte les volumes des articles à y placer.
Nous sommes aujourd’hui au tout début des robots auto-apprenants. Si d’une façon générale, l’apprentissage par renforcement est utilisé pour résoudre des problèmes d’optimisation, en robotique, cette technologie devrait prendre son essor afin d’améliorer les mouvements ou la préhension des robots. D’autres usages des robots auto-apprenant sont encore à découvrir mais on peut facilement se projeter sur l’apport que pourront avoir ces robots afin d’accompagner l’humain dans des tâches hautement techniques, répétitives ou potentiellement dangereuses.