Derrière cette application amusante baptisée AutoDraw se trouve un programme sophistiqué d’intelligence artificielle, que les internautes ont contribué à façonner.

Si vous êtes du genre à dessiner des chats qui ressemblent à des hippopotames, peut-être pourriez-vous trouver utile le nouveau gadget de Google. AutoDraw est une application de dessin vous permettant de gribouiller ce qui vous passe par la tête. Elle tentera de deviner ce que représente votre croquis, vous fera quelques propositions et le transformera en un dessin plus présentable.

AutoDraw est ainsi capable de comprendre en temps réel que cette chose quasiment informe barbouillée en trois secondes est en fait un vélo.

Le croquis original.
AutoDraw reconnaît que le croquis initial est un vélo, et le transforme en dessin plus présentable.
AutoDraw reconnaît que le croquis initial est un vélo, et le transforme en dessin plus présentable. AutoDraw

L’outil est efficace et dispose donc d’un talent certain pour le Pictionary, même s’il fait parfois des erreurs. Et, bien que le catalogue d’objets qu’il est capable de reconnaître soit assez vaste, il ne connaît pas, par exemple, la raclette, Batman, ou d’autres croquis moins avouables.

Une technologie sophistiquée

Cela s’explique par la technologie avec laquelle il a été conçu. Car derrière cette application amusante se trouve en fait un système d’intelligence artificielle très sophistiqué, capable d’apprendre à identifier les formes esquissées par les humains.

Pour y parvenir, ce programme de « machine learning » a dû être « entraîné » au préalable, en s’appuyant sur des milliers d’exemples de croquis. En clair, pour apprendre à reconnaître un brouillon de chat, il a fallu lui fournir de très nombreux croquis de félins dont il a analysé les points communs. Même chose pour une maison, une fleur, et tous les objets qu’AutoDraw est aujourd’hui capable de reconnaître.

Mais où trouver autant d’exemples de brouillons ? Si Google ne le dit pas explicitement, ceux-ci sont probablement issus de QuickDraw, une autre application sortie il y a quelques mois par Google, et qui repose, explique l’entreprise, « sur la même technologie ».

Ce petit jeu suggère aux internautes de dessiner en vingt secondes une forme précise, comme un réveil, un chameau, un feu de camp, une échelle ou un ours en peluche. Le programme doit ensuite tenter de deviner ce dont il s’agit. « Plus vous jouez avec, plus il apprend », expliquait alors Google. Les milliers de parties des utilisateurs ont ainsi « nourri » et amélioré le programme, capable, au fur et à mesure, de reconnaître de mieux en mieux les formes suggérées par Google. Ce qui pourrait expliquer qu’AutoDraw ne reconnaisse ni la raclette, ni Batman : il n’a jamais été demandé aux internautes de dessiner ces sujets. En clair, en jouant à QuickDraw, les utilisateurs ont servi, sans forcément s’en rendre compte, à développer une technologie de Google.

La transformation du gribouillis en un dessin de qualité sur AutoDraw est ensuite bien plus simple : une fois que le programme a deviné qu’il s’agissait d’un chat, il pioche dans les jolis dessins de félins dont il dispose, créés spécialement par des graphistes.

Un domaine stratégique

Ce type de technologie de reconnaissance visuelle, qui repose sur des réseaux de neurones artificiels, ne sert pas seulement à améliorer les gribouillis des internautes, tant s’en faut. Google est devenu un des leaders de ce domaine, dans lequel il investit beaucoup, et qui a considérablement progressé ces dernières années.

Google, comme d’autres entreprises, entraîne surtout ses programmes à reconnaître des éléments sur des photos ou des vidéos, et même à décrire les scènes qu’elles représentent. Un enjeu énorme pour Google, qui jusqu’alors n’était capable de référencer efficacement que des éléments textuels, ou liés à du texte.

La reconnaissance d’images peut aussi servir dans d’innombrables domaines. Des applications permettent ainsi aux promeneurs de reconnaître les plantes ou les oiseaux. D’autres outils, consacrés à l’imagerie médicale, viennent appuyer le travail des médecins. Ces technologies pourraient aussi aider les réseaux sociaux à identifier immédiatement une image violente – ou une poitrine. Quand à la reconnaissance faciale, elle donne aussi d’excellents résultats. Même si les géants du Web évitent de le crier sur tous les toits.

Source

 

LAISSER UN COMMENTAIRE