Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Corps en Immersion

Une actualité dans les arts et les sciences à travers les corps pluriels.

Le « deep learning », une technologie d'apprentissage, basée sur des réseaux de neurones artificielles

Publié le 26 Juillet 2015 par Anaïs BERNARD in actualite

Une forêt, vue par Deep Dream. Joan Campderros-i-Canas/CC BY 2.0 En savoir plus sur http://www.lemonde.fr/pixels/article/2015/07/24/comment-le-deep-learning-revolutionne-l-intelligence-artificielle_4695929_4408996.html#TQs7IMxBS532BjZF.99

Une forêt, vue par Deep Dream. Joan Campderros-i-Canas/CC BY 2.0 En savoir plus sur http://www.lemonde.fr/pixels/article/2015/07/24/comment-le-deep-learning-revolutionne-l-intelligence-artificielle_4695929_4408996.html#TQs7IMxBS532BjZF.99

Concrètement, le deep learning est une technique d'apprentissage permettant à un programme, par exemple, de reconnaître le contenu d'une image ou de comprendre le langage parlé – des défis complexes, sur lesquels la communauté de chercheurs en intelligence artificielle s'est longtemps cassé le nez. « La technologie du deep learning apprend à représenter le monde. C'est-à-dire comment la machine va représenter la parole ou l'image par exemple », pose Yann LeCun, considéré par ses pairs comme un des chercheurs les plus influents dans le domaine. « Avant, il fallait le faire à la main, expliquer à l'outil comment transformer une image afin de la classifier. Avec le deep learning, la machine apprend à le faire elle-même. Et elle le fait beaucoup mieux que les ingénieurs, c'est presque humiliant !»

 

Pour comprendre le deep learning, il faut revenir sur l'apprentissage supervisé, une technique courante en IA, permettant aux machines d'apprendre. Concrètement, pour qu'un programme apprenne à reconnaître une voiture, par exemple, on le « nourrit » de dizaines de milliers d'images de voitures, étiquetées comme telles. Un « entraînement », qui peut nécessiter des heures, voire des jours. Une fois entraîné, il peut reconnaître des voitures sur de nouvelles images.

Le deep learning utilise lui aussi l'apprentissage supervisé, mais c'est l'architecture interne de la machine qui est différente : il s'agit d'un « réseau de neurones », une machine virtuelle composée de milliers d'unités (les neurones) qui effectuent chacune de petits calculs simples. « La particularité, c'est que les résultats de la première couche de neurones vont servir d'entrée au calcul des autres », détaille Yann Ollivier, chercheur en IA au CNRS, spécialiste du sujet. Ce fonctionnement par « couches » est ce qui rend ce type d'apprentissage « profond ».

 

A chaque étape – il peut y avoir jusqu'à une vingtaine de couches –, le réseau de neurones approfondit sa compréhension de l'image avec des concepts de plus en plus précis. Pour reconnaître une personne, par exemple, la machine décompose l'image : d'abord le visage, les cheveux, la bouche, puis elle ira vers des propriétés de plus en plus fines, comme le grain de beauté. « Avec les méthodes traditionnelles, la machine se contente de comparer les pixels. Le deep learning permet un apprentissage sur des caractéristiques plus abstraites que des valeurs de pixels, qu'elle va elle-même construire », précise Yann Ollivier.

 

Outre sa mise en œuvre dans le champ de la reconnaissance vocale avec Siri, Cortana et Google Now, le deep learning est avant tout utilisé pour reconnaître le contenu des images. Google Maps l'utilise pour déchiffrer le texte présent dans les paysages, comme les numéros de rue. Facebook s'en sert pour détecter les images contraires à ses conditions d'utilisation, et pour reconnaître et taguer les utilisateurs présents sur les photos publiées – une fonctionnalité non disponible en Europe. Des chercheurs l'utilisent pour classifier les galaxies. Yann LeCun fait aussi depuis plusieurs années cette démonstration impressionnante : il a créé un programme capable de reconnaître en temps réel les objets filmés par la webcam d'un simple ordinateur portable.

 

Une des réalisations les plus poussées et les plus spectaculaires du deep learning a eu lieu en 2012, quand Google Brain, le projet de deep learning de la firme américaine, a été capable de « découvrir », par lui-même, le concept de chat. Cette fois, l'apprentissage n'était pas supervisé : concrètement, la machine a analysé, pendant trois jours, dix millions de captures d'écran issues de YouTube, choisies aléatoirement et, surtout, non étiquetées. Un apprentissage « en vrac » qui a porté ses fruits : à l'issue de cet entraînement, le programme avait appris lui-même à détecter des têtes de chats et des corps humains – des formes récurrentes dans les images analysées. « Ce qui est remarquable, c'est que le système a découvert le concept de chat lui-même. Personne ne lui a jamais dit que c'était un chat. Ça a marqué un tournant dans le machine learning », a expliqué Andrew Ng, fondateur du projet Google Brain, dans les colonnes du magazine Forbes.

 

Plus récemment – et plus gadget –, Google a encore fait parler de lui avec «Deep Dream », un programme permettant, en quelque sorte, de visualiser un processus de deep learning, avec des résultats étonnants. Les formes repérées, analysées et interprétées dans une image par le programme étaient visuellement « augmentées ». En clair, « on demande au réseau “quoi que tu voies, on en veut plus !” (...) Si un nuage ressemble un peu à un oiseau, le réseau va le faire ressembler encore plus à un oiseau », expliquent les auteurs de ce travail sur un blog. Résultat : un cochon-escargot dans les nuages, des palais merveilleux de toutes les couleurs et des circonvolutions hypnotisantes dans les tableaux des grands maîtres…


 

 

Pour lire la totalité du texte se référer à l’article Comment le « deep learning » révolutionne l’intelligence artificielle, par Morgane Tual, le 24/07/2015, Le Monde.fr

 

Commenter cet article