Longtemps considérés comme incompatibles, l’art et les machines profitent des technologies les plus avancées dans le domaine de l’apprentissage automatique, pour se retrouver. Panorama non-exhaustif des récentes avancées où l’IA s’installe aux côtés des artistes.
Dans le film I, Robot sorti en 2004, l’officier de police incarné par Will Smith demande au robot Sonny si un robot serait capable d’écrire une symphonie, ou de transformer une simple toile en un chef d’œuvre. Cette question illustre bien la vision répandue que l’art serait ce qui distinguerait les Hommes, créant les œuvres et des machines (voire, les animaux) qui en seraient incapables.
Les travaux de Turing, posant dans les années 1950 les bases de l’intelligence artificielle, battent en brèche cette vision anthropocentrée. Les machines pourraient parfaitement être capables de reproduire le comportement des humains, via un « jeu d’imitateur ». Celui-ci fait directement écho à la qualification des artistes comme « imitateurs de la nature » selon Platon. Il faut néanmoins attendre les années 2010 et l’avènement des techniques dites d’apprentissage profond (Deep Learning) pour voir apparaître des algorithmes créateurs d’art, et ce sans que l’humain ne puisse percevoir son côté « robotique ».
Dans cet article, nous montrons quelques exemples de machines artistes, mais également d’algorithmes capables d’expertises en art, et les limites de ces avancées.
IA et art : Les machines expertes
Face aux machines, l’expertise dans le domaine de la peinture fait de la résistance. Les yeux des experts parviennent à déceler avec une finesse remarquable si un tableau est un faux ou non, pour une raison simple : ils savent où chercher, là où les ordinateurs restent « stupides » et regardent les toiles dans leur intégralité. Mais récemment, une équipe de scientifiques a annoncé avoir résolu une controverse de plusieurs siècles : le tableau Samson et Dalila exposé à la National Gallery de Londres ne serait pas de Rubens, avec 91% de certitude. Pour obtenir ce chiffre, les chercheurs ont entraîné une IA de type « réseaux de neurones convolutifs » (CNN), particulièrement efficaces dans la reconnaissance d’images, avec plus de 400 tableaux dont l’authentification ne fait pas débat. Ils ont ensuite demandé au réseau de calculer la probabilité que des échantillons du tableau soient de Rubens ou non. Les résultats laissent peu de place au doute : chaque échantillon fut étiqueté « faux » à plus de 90%.
Une collaboration entre experts et ingénieurs machine learning a également vu le jour dans le domaine de la musique : le 9 octobre 2021, à Bonn, la dixième symphonie de Beethoven, achevée grâce à une IA, a été jouée pour la première fois en public. L’algorithme, permettant de remplir les trous de la partition originale, a certes appris « tout seul » toute l’œuvre de Beethoven, mais les ajustements de celui-ci ont été possibles grâce aux allers-retours entre musicologues et ingénieurs IA. Dans l’article, le directeur IA du projet explique notamment comment les spécialistes devaient renseigner chaque portion de la partition existante, indiquant s’il s’agissait d’une fugue ou d’un scherzo (entre autres). Une fois ce paramètre renseigné, la machine construisait la portion de symphonie autour de celle existante.
La révolution GPT-3 : la machine créatrice d'art
Le principe d’art généré par IA n’est pas nouveau : en 2018, par exemple, un tableau peint par une IA avait été vendu plus de 430.000$ aux enchères, et suscitait la polémique, l’algorithme utilisé ayant été mis en ligne en open-source par un autre développeur.
Néanmoins, en mai 2020, Open AI – fondée entre autres par Elon Musk – annoncait dans un article la publication de leur nouveau modèle de langage naturel : GPT-3, changeant radicalement la donne. Le mastodonte – 175 millions de paramètres, beaucoup trop pour nos machines de bureau – est capable de générer un texte cohérent à partir d’instructions simples. GPT-3, est un transformer – la nouvelle génération des algorithmes deep learning, et a été entraîné à partir de près de 500 milliards de sources textuelles. Afin de s’améliorer, l’algorithme devait reconstituer correctement des phrases dont certains mots avaient été supprimés, chaque erreur étant pénalisée, modifiant ainsi les paramètres du modèle.
Les résultats obtenus par GPT-3 ont d’emblée bluffé ses utilisateurs, et les exemples de textes générés foisonnaient sur Twitter. L’écrivain Gwern Branwen s’est amusé à proposer au modèle d’écrire de nombreux pastiches, dont un nouvel Harry Potter écrit avec le style de Hemingway. Le youtubeur technophile Tom Scott a lui demandé au modèle de lui générer de nouvelles idées de vidéos… étonnamment réalistes !
Open AI ne s’est pas arrêté là : la société a dérivé ce modèle pour obtenir Dall-E, un algorithme capable de générer des images à partir d’un texte simple. On a ainsi pu voir des fauteuils avocat dignes des salons design, ou des radis en tutu promenant un chien.
Un danger pour l'art et ses créateurs ?
Ces progrès dans le domaine de l’IA créatrice de contenu génèrent inévitablement des inquiétudes, exprimées par la société OpenAI elle-même dans l’article scientifique présentant le modèle. Il fait craindre la précarisation de certains métiers, dont ceux du journalisme, l’IA pouvant créer différents articles complets à partir de quelques informations de base.
Les dernières avancées dans le domaine de l’IA nous obligent donc à être de plus en plus vigilants sur les sources d’informations. De nouvelles questions juridiques se posent également : est-ce qu’une machine peut prétendre à des droits d’auteur ? Les autorités américaines ont récemment tranché : c’est non.
IA et opportunités pour le conseil
La pertinence de ces nouveux modèles d’IA est enthousiasmante, et l’avenir des algorithmes directement issus ou inspirés de GPT-3 s’annonce rayonnant, du moins lorsqu'on imagine les débouchés. Au-delà de l’art, les modèles s’avèrent être de bons designers, codeurs, et pourraient bien s’imposer aux côtés de métiers créatifs comme ceux de la pub, du marketing… et demain le conseil ? Nous, consultants, utiliserons-nous des algorithmes pour déterminer et planifier la solution optimale pour nos clients ?