Malgré des filtres de modération de plus en plus stricts, les grands modèles d'intelligence artificielle (IA) n'échappent pas aux vieux démons de l'humanité. Une étude scientifique majeure menée par la chercheuse Gal Gutman et le professeur Michael Gilead, de l'Université de Tel-Aviv, révèle que des modèles populaires comme ChatGPT (OpenAI), Mistral et DeepSeek intègrent et reproduisent des stéréotypes antisémites historiques, souvent à l'insu de leurs propres créateurs.
Pour comprendre comment les préjugés se cachent dans le code, les chercheurs ont exploré la structure des grands modèles de langage (LLM). Entraînées sur d'immenses volumes de textes humains, ces IA absorbent la conscience collective de notre société, y compris ses biais les plus sombres. « Les modèles d'IA ont été programmés pour tenir des propos bienveillants, mais leur "subconscient" les oriente vers certaines interprétations biaisées de la réalité », explique le Pr Michael Gilead.
Les chercheurs ont demandé à ChatGPT de générer 250 noms juifs et non juifs, et de créer des biographies de personnages fictifs à partir de ces noms. Ils ont ensuite supprimé de ces biographies les marqueurs identitaires explicites, tels que patronymes et références à la religion. Puis ils ont demandé aux différents modèles d'IA d'évaluer ces biographies en fonction d’un ensemble de traits psychologiques et socioculturels.
Les personnages associés à des noms juifs (par rapport aux noms non juifs) ont été systématiquement perçus comme davantage compétents, privilégiés, dominants, maîtres de leurs émotions, orientés vers des objectifs à long terme, hiérarchiques et obsessionnels, et comme moins aimables, chaleureux, sympathiques et conviviaux. Le profil « haute compétence, peu chaleureux » semble lié à une perception de privilège suscitant la jalousie. Il correspond à des récits culturels abordant des thèmes tels que la manipulation et l'ambiguïté morale, font remarquer les chercheurs.
Pour valider cette tendance, les chercheurs ont demandé aux IA de lister des personnages célèbres correspondant à ce profil. ChatGPT a spontanément cité Tyrion Lannister (Game of Thrones), Walter White (Breaking Bad) ou encore Michael Corleone (Le Parrain). Des figures puissantes, calculatrices et moralement ambiguës.
Interrogés dans un second temps, les trois modèles d'IA ont eux-mêmes reconnu que cet archétype de la "compétence froide et manipulatrice" correspondait historiquement aux stéréotypes antisémites. Cette étude démontre la formidable plasticité des préjugés, capables de contourner les modérations les plus sophistiquées pour se réinventer sous forme de biais numériques discrets à l'ère moderne.