En produisant des images de soldats nazis d'origine africaine et asiatique, le moteur de création d’images de Google s'est pris les pieds dans le tapis. Une situation injuste au regard de l'investissement massif de la firme dans l’IA générative.
100 chroniques. 100 ! Merci Stratégies. Je finis par faire partie des meubles, j’avais pourtant commencé cette collaboration sous le titre « Mobilis in Mobile », la devise du Nautilus. Et pour cette centième chronique, j’ai eu un beau cadeau. Peut-être le plus bel acte manqué logiciel de ma carrière.
Sous pression dans la course à l’intelligence artificielle, le leader mondial de la publicité a lancé son moteur de création d’images Gemini, en réplique à Midjourney ou Dall-E d’OpenAI. Après avoir réuni toutes ses équipes dédiées à l’intelligence artificielle sous une même bannière, initié de nombreux développements et créé des produits distincts, Gemini intégrait Bard le chatbot maison pour (enfin) présenter au marché une suite complète et cohérente en réponse à OpenAI. Comme à chaque fois, lors de l’ouverture d’un service aussi attendu, les passionnés l’ont testé sans retenue. Et l’un d’eux a demandé à Gemini de lui produire des illustrations d’un soldat de l’armée allemande en 1943. Vous connaissez sans doute la suite, elle a fait le tour du monde. L’intelligence artificielle de Google lui a proposé quatre soldats, parité parfaite, deux femmes et deux hommes, et un peu comme les publicités Benetton de mon enfance, a donné à ces soldats des origines diverses, caucasienne, afro-descendante, asiatique. L’IA maîtrise décidément ses classiques, le point Godwin atteint à la vitesse d’un processeur Nvidia. Que nous dit, début 2024, ce cas d’école ?
It’s AI stupid
L’IA est partout. Apple croule sous le cash et conserve son titre de première capitalisation mondiale. Bien que talonnée par Microsoft et Nvidia, le fournisseur de pelles et de pioches de la ruée vers l’IA, l’entreprise se sent obligée d’annoncer avec pertes et fracas l’abandon de son projet de véhicule électrique. Ce devait pourtant être l’objet mobile ultime. Non, l’entreprise annonce au marché qu’elle se concentre sur l’IA. Malheur à ceux qui ne priorisent pas l’intelligence artificielle et dans le concours du « winner takes all » numérique, il vaut toujours mieux faire la course en tête.
It’s stupid AI
Pourtant l’IA, c’est compliqué. Très peu d’appelés, encore bien moins d’élus. La mésaventure de Gemini est une démonstration de la difficulté à proposer des modalités aussi simple d’accès à des services aussi effroyablement complexes. Elle signale nos limites aussi, non pas celles de l’intelligence humaine encore, mais plutôt celles d’ordre chimique, pour ainsi dire impossibles à anticiper, qui font qu’une formule peut muter, un algorithme peut précipiter une réponse qui n’est pas seulement un « faux », une hallucination, mais bien un agrégat altéré et déviant.
Kodak ou Xerox Park ?
On peut remercier la firme de Sundar Pichai de nous rappeler à nos conditions respectives, humains sensibles et machines ineptes mais cette histoire est injuste. « Quand ça veut pas… » diront les plus fatalistes pour commenter les efforts du géant de Mountain View. Pourtant, avec la start-up anglaise DeepMind acquise en janvier 2014, l’entreprise a tout inventé avant les autres en investissant massivement pendant vingt ans dans l’IA générative. Mais ses parts sur ce marché reflètent plus que des proportions inverses : quand elle en détiendrait 10 %, OpenAI serait à 35 %, en gardant des pincettes puisque le marché reste difficile à circonscrire. Est-elle en train de subir le syndrome Kodak ? La société d’étude Gartner prédit une baisse de 25 % du volume des recherches sur son moteur au moment où les internautes vont adopter de nouveaux usages et ainsi d’autres outils. Le plus surprenant, c’est qu’à défaut de réussir la commercialisation de sa recherche, Google reste un acteur éminemment puissant et innovant. On peut tester un de ses derniers projets Genie pour s’en convaincre. Un modèle qui permet de créer des environnements « jouables » sur la base de simples images. Sidérant. Alors, quelle sera sa trajectoire ? Entre Kodak et le fameux Xerox Park à l’origine de la plupart des innovations qui font l’informatique moderne ? Microsoft a mis vingt ans à réussir sa mue et sortir de cette trajectoire difficilement résistible.
Regard de biais
Enfin, comme dernier enseignement de cette anecdote, concentrons-nous sur le plus évident. Ne nous voilons pas la face, nous éprouvons une double Schadenfreude, une sorte de joie malsaine à voir un géant se prendre les pieds dans son tapis numérique. Nous nous souvenons de l’horreur éprouvée quand ses algorithmes ne savaient pas faire la différence entre des humains noirs et des gorilles, les reproches quand on demandait une image de PDG et celle d’un aide-soignant et que l’on obtenait inéluctablement un homme dans un cas et une femme dans l’autre. À vouloir trop bien faire, on nous propose une jolie nazie asiatique de toute bonne foi.
L’IA est un miroir qui nous regarde dans les yeux : nos biais, nos contradictions, notre bêtise autant que notre intelligence. Nous n’avons pas d’autre choix que de relever le défi civilisationnel que représente l’accès de centaines de millions de personnes à des technologies aussi sophistiquées, grâce à une interface aussi simple, sans pouvoir leur permettre de maîtriser son fonctionnement, ses principes et ses sources.
Google a bon dos, le dos large même, profitons-en, mais restons sur nos gardes : il y aura plus difficile à reconnaître qu’un soldat allemand en 1943.