L'utilisation de Siri ou de tout assistant vocal de nos jours fait désormais partie de notre quotidien pour effectuer une variété de tâches rapidement et facilement. Cependant, tout le monde ne sait pas que lorsque nous exploitons le potentiel de ces outils, nous nous rapprochons en fait de l'apprentissage profond. Un terme, celui-ci, rendu dans notre langue par l'expression "apprentissage profond", que certains appellent "apprentissage hiérarchique", et qui est lié de deux manières au concept d'apprentissage automatique et, plus généralement, à celui d'intelligence artificielle, ou IA, de l'anglais Artificial Intelligence. Si l'apprentissage automatique est une branche spécifique de l'intelligence artificielle, de la même manière, la technologie étudiée dans ce guide est un sous-ensemble de la première, et sous-tend quelque chose de beaucoup plus large que le simple apprentissage automatique à plusieurs niveaux. Par conséquent, comme nous l'avons déjà dit, les applications sont innombrables, et nous irons naturellement découvrir ensemble les principales dans les paragraphes suivants.
La définition du deep learning
La définition technique du deep learning ou apprentissage profond est celle d'une classe d'algorithmes d'apprentissage automatique, c'est-à-dire le domaine de recherche de l'apprentissage automatique, le machine learning déjà mentionné, et de l'intelligence artificielle qui se base sur différents niveaux de représentation, correspondant à des hiérarchies de caractéristiques de facteurs ou de concepts, où les concepts de haut niveau sont définis sur la base de ceux de bas niveau. La définition de l'Observatoire de l'intelligence artificielle du Politecnico di Milano est encore plus compréhensible pour les non-experts : l'apprentissage profond est en effet décrit comme un ensemble de techniques basées sur des réseaux de neurones artificiels organisés en différentes couches, où chaque couche calcule les valeurs de la suivante de manière à traiter l'information de manière de plus en plus complète.
Ce n'est donc pas une coïncidence si parmi les architectures de l'apprentissage profond sont habituellement mentionnés les réseaux neuronaux profonds, la convolution des réseaux neuronaux profonds, les réseaux de croyance profonds et les réseaux neuronaux récursifs. Ils représentent tous une approche selon laquelle l'apprentissage se fait grâce à des données obtenues par des algorithmes, principalement de calcul statistique.
Vous aurez donc compris que la grande quantité de données traitées par les réseaux neuronaux suit un " chemin " très similaire à celui qui se déroule dans le cerveau humain, qui inspire le fonctionnement de ces mêmes réseaux artificiels. De nombreux chercheurs et scientifiques sont connus pour leur engagement dans l'apprentissage profond, comme Andrew Yan-Tak Ng, fondateur de Google Brain, Ian J. Goodfellow, reconnu comme l'un des meilleurs innovateurs de moins de 35 ans au monde par le MIT Boston, Yoshua Bengio, Ilya Sutskever et Geoffrey Everest Hinton, l'une des figures clés de l'intelligence artificielle.
C'est leur contribution qui nous permet aujourd'hui de définir l'apprentissage profond comme un système qui exploite une classe d'algorithmes d'apprentissage automatique qui, tout d'abord, utilisent différents niveaux d'unités non linéaires en cascade pour effectuer des tâches d'extraction et de transformation de caractéristiques, chaque niveau successif utilisant la sortie du niveau précédent comme entrée. Les algorithmes reposent alors sur un apprentissage dit non supervisé de plusieurs niveaux hiérarchiques de caractéristiques de données, créant ainsi une représentation hiérarchique. Non seulement cela, mais de la manière dont ils sont conçus, ils apprennent plusieurs niveaux de représentation qui correspondent à différents niveaux d'abstraction, générant ainsi une hiérarchie de concepts.
C'est seulement vers 2000 que l'on a commencé à parler d'apprentissage profond. En relativement peu de temps, cependant, ses utilisations se sont multipliées comme une traînée de poudre grâce aux progrès technologiques et à des réseaux neuronaux de plus en plus sophistiqués. Les premières études sur les réseaux neuronaux multicouches ont été réalisées et publiées par le scientifique japonais Kunihiko Fukushima, qui a développé, en 1975, le modèle du cognitron, puis celui du néo-cognitron. Le même chercheur, a introduit l'idée de la zone de connexion pour les neurones qui s'est développée dans les réseaux neuronaux convolutifs.
Dans les années 80, l'analyse des réseaux neuronaux artificiels multicouches s'est poursuivie de manière plus décisive, mais ce n'est que dans la dernière décennie, notamment grâce à l'avènement du Big Data et au dépassement de certaines limitations, qu'ils montrent tout leur potentiel dans une gamme variée de secteurs. Aujourd'hui, les systèmes de deep learning, parmi de nombreuses autres utilités, permettent, par exemple, l'identification d'objets dans des images et des vidéos, la transcription de la parole en texte, ou l'identification et l'interprétation des intérêts des utilisateurs en ligne, en renvoyant des résultats de recherche plus proches de leurs besoins spécifiques.
Comment fonctionne le deep learning
Comme clarifié dans le paragraphe précédent du guide, le deep learning base tout son fonctionnement sur la classification et la sélection successive des données les plus pertinentes afin de parvenir à une conclusion aussi optimale que possible. Un fonctionnement qui suit celui de notre cerveau biologique, soit pour formuler la bonne réponse à une question, soit pour arriver à la résolution d'un problème spécifique, soit encore pour déduire une hypothèse logique. Certains d'entre vous se souviennent peut-être du célèbre cas d'AlphaGo, un logiciel qui a battu en 2016 le champion du monde de Go, avec plusieurs années d'avance.
Le deep learning se comporte donc de la même manière que le raisonnement humain, mais en utilisant les réseaux de neurones artificiels dont nous parlions, c'est-à-dire des modèles mathématico-informatiques basés sur le fonctionnement des réseaux de neurones biologiques, eux-mêmes constitués d'interconnexions d'informations. En effet, un réseau neuronal est un système de type adaptatif : il peut modifier sa structure, composée de nœuds et d'interconnexions relatives, en se basant sur des données externes et internes, qui connectent et traversent le réseau neuronal pendant la phase d'apprentissage et de raisonnement.
L'apprentissage est alors de type automatique et "profond", où par profond on entend sur plusieurs niveaux. Ce type d'apprentissage s'est révélé résolument plus puissant que les technologies d'IA précédentes, à tel point qu'il a récemment attiré une attention médiatique sans précédent. Ainsi que, inévitablement, l'attention scientifique et économique. Les limites ne manquent pas, mais l'apprentissage profond peut certainement se distinguer par la qualité des résultats obtenus, avec un avantage énorme correspondant pour apprendre à résoudre des problèmes complexes de reconnaissance des formes. Bien que la demande d'énormes capacités de calcul puisse constituer une limite, l'évolutivité de l'apprentissage profond à mesure que la quantité de données et d'algorithmes disponibles augmente est ce qui le différencie de l'apprentissage automatique.
Le premier améliore en effet ses performances à mesure que la quantité de données augmente, tandis que le second, une fois qu'il a atteint un certain niveau de performance, n'est plus en mesure d'affiner ses performances. En effet, le réseau neuronal complexe apprend de manière autonome à analyser les données brutes et à effectuer une certaine tâche. L'ordinateur est donc capable d'"apprendre par lui-même", sans instructions humaines, après une phase initiale de formation. Le but ultime est d'économiser du temps et des ressources, en particulier dans les travaux de routine, qui sont effectués beaucoup plus efficacement et rapidement que n'importe quel humain, sans aucune sorte d'effort et en maintenant un niveau de qualité pratiquement constant.
Les applications de l'apprentissage profond
L'apprentissage profond
Des progrès énormes ont été réalisés dans ce domaine, même si, aujourd'hui encore, certaines décisions de l'apprentissage profond ne sont pas entièrement compréhensibles d'un point de vue purement humain. Cela n'empêche pas, comme on le voit maintenant, l'amélioration constante des technologies liées au deep learning, plus encore grâce à la quantité de données disponibles et à la disponibilité d'infrastructures ultra performantes, la référence, en particulier, étant les CPU et les GPU. Il n'est pas surprenant que l'apprentissage profond soit actuellement appliqué dans diverses industries, et surtout qu'il continuera à être appliqué et à s'étendre à de nombreux autres domaines de notre vie quotidienne dans un avenir proche. Il suffit de penser aux voitures sans conducteur, aux drones robots pour la livraison de colis, à la reconnaissance et à la synthèse de la voix et du langage pour les chatbots et les robots de service, ou encore à la reconnaissance faciale à des fins de sécurité.
Il existe également des applications médicales en radiologie pour la détection précoce de certaines formes de cancer, ou la possibilité d'identifier facilement les séquences génétiques de certaines maladies pour produire des médicaments plus efficaces. On peut également citer la coloration automatique d'images en noir et blanc, la traduction simultanée, la classification d'objets sur une photographie, la génération automatique d'écriture et de texte, ainsi que la division intuitive en légendes. De même, le jeu automatique a été développé, le système apprenant de manière autonome comment jouer à un jeu donné. Pour conclure, il ne faut pas sous-estimer les capacités de l'apprentissage profond à exposer les irrégularités dans les activités des systèmes grâce à leur apprentissage indépendant et continu, en particulier pour les cyberattaques dangereuses ou les séquences vidéo "intelligentes" installées dans les aéroports les plus avancés.
Après avoir dit cela, il est toutefois important de souligner que l'apprentissage profond ne peut et ne doit pas être la meilleure solution technologique pour chaque problème. De nombreux chercheurs, notamment au cours des cinq dernières années, sont convaincus que l'on trouvera bientôt des approches plus efficaces, et peut-être moins coûteuses, qui rendront obsolète l'apprentissage hiérarchique basé sur le fonctionnement du cerveau humain. Comme s'il s'agissait d'un phénomène passager, réduit pour ne représenter qu'un seul des nombreux incroyables ! - les manifestations de l'intelligence artificielle.