Le biais de la critique des biais de l’IA / The bias of AI bias criticism

L’une des critiques les plus communes (et pour ainsi dire automatiques) de l’IA est celle de ses biais. On critique dans l’induction statistique sa propension à mettre en avant certains points de vue et à en minorer d’autres, en renforcant le sexisme, le spécisme, le racisme et l’intolérance, en caricaturant les tendances les plus méprisables de l’être humain.

Qu’exige-t-on en échange ? Une absence de biais ? D’autres biais ? Une transparence et une lisibilité sans reste de ces biais ?

Si l’on a tendance à transformer fantasmatiquement l’IA en une persona autonome dôtée d’une personnalité, il faut plutôt la considérer comme une nouvelle manière de naviguer et de consulter une bibliothèque. Celle-ci, devenue illisible au fil des trois dernières décennies par l’hypermnésie des données massives prenant la place des archives constituées, a été transformée en statistiques vectorisées et devient finalement possibilités contrefactuelles, amenant les données à devenir des possibles.

Ceci est problématique a plus d’un titre et signale, à mes yeux, un changement d’ontologie, de régime de vérité et d’époque. Mais derrière la demande parfois naïve de minorer les biais, il y a l’idée profonde d’une rupture culturelle qui n’aurait plus de subjectivité, de choix, d’erreurs. Faut-il rompre avec nos bibliothèques? Peut-on même espérer une neutralité ? Et si tel n’est pas le cas, s’agit-il d’une bataille de biais contre d’autres biais ? Par rapport à quoi biaise-t-on ? Par rapport à quelle valeur de vérité? Existe-t-il quelque chose en dehors d’un biais ou, comme le dirait Nietzsche, d’une perspective?

C’est qu’on a tendance à considérer illusoirement l’IA de façon autonome (pour en arrière-plan supposer sans démonstration conséquente notre propre autonomie), plutôt que de voir que ses résultats sont lus et analysés par des êtres humains. La critique des biais met souvent de côté la réflexivité du contexte de réception anthropotechnologique et passe donc à côté de la moitié du problème.

Si l’IA caricature nos points de vue, elle offre par là même une image sur ceux-ci permettant de voir comme du dehors nos propres subjectivités et de naviguer ainsi dans les lieux communs, les clichés et les idées reçues. C’est un outil de critique culturelle à grande échelle.

L’un des exemples fréquents donnés au biais de l’IA consiste dans le fait de générer une image d’une réunion de médecins : on obtient comme résultat une réunion de médecins masculins, blancs, CISgenre, etc. Mais il est fort aisé de modifier en quelques secondes de codage ces biais par un nouvel alignement et par exemple d’avoir la proportion ethnique selon le pays considéré (ce qu’on fait d’ailleurs rapidement des entreprises comme OpenAI suite à ces critiques comme le démontre les images ici présentées). Il est par contre beaucoup plus difficile de lutter contre ces inégalités dans la réalité puisque la formation d’un médecin prend une décennie… L’exigence d’avoir une réunion de médecins différente est aussi celle d’avoir une image qui ne correspond pas à la réalité, aussi critiquable que celle-ci soit. De se donner donc une image désirable, idéale, en correspondance avec ce que nous souhaitons. Là encore c’est une représentation de la volonté de puissance renommée désirabilité.

L’impatience par rapport aux biais de l’IA reste en son fond instrumentale et exprime la volonté de puissance qui détermine la technique. Elle occulte deux possibilités : – d’une part, les biais de l’IA nous permettent d’observer nos propres biais et d’en prendre conscience, c’est un miroir tendu à notre réflexivité. – D’autre part, ces résultats sont toujours lus par des êtres humains et ils croisent leurs biais, leurs subjectivités, en résonance ou en dissonance, de sorte que ce que produit l’IA n’est pas le fin mot de l’histoire. Elle rentre en circuit avec nous et nous avec elle.

La critique des biais de l’IA présuppose souvent une transparence, une lisibilité, une neutralité et un désir d’en finir avec la subjectivité. Elle oublie que l’IA est une nouvelle façon de lire la culture humaine, aussi incomplète et oublieuse est-elle, et ainsi de l’interpréter. Bref, elle met de côté l’herméneutique historique propre à toute lecture et délègue encore plus aux automatismes de l’IA ce qui devrait constituer notre faculté de réflexivité. La critique, comme c’est souvent le cas, reproduit ce qu’elle croit contester. En mettant en scène la puissance de vérité de l’IA, elle l’institue. Par là même, elle occulte la finitude non-humaine, son imperfection, sa perfectibilité et son hétéronomie interprétative.


One of the most common (and virtually automatic) criticisms of AI is one of bias. The statistical induction is criticized for its propensity to highlight certain points of view and to undermine others, to reinforce sexism, speciesism, racism and intolerance, to caricature the most despicable tendencies of human beings.

What is required in return? An absence of bias? Other Biases? Transparency of these biases?

If AI is being fantastically transformed into an autonomous person with a personality, it should be viewed as a new way of browsing and consulting a library. This, which became unreadable by the hypermnesia of massive data taking the place of constituted archives, was transformed into statistics and finally became counterfactual possibilities, causing data to become possible.

This is problematic in more ways than one, and signals, in my view, a change in ontology and epoch. But behind the sometimes-naive demand to minimize bias lies the deeper idea of a cultural rupture that no longer entails subjectivity, choice, and error. Can we even hope for neutrality? If not, is it a battle of bias against bias? What are we biased about? Is there anything besides a bias?

This is because we tend to think about AI autonomously (in the background, assuming that we have no meaningful demonstration of our own autonomy), rather than seeing its results read and analyzed by humans. Criticism of bias often overlooks the reflexivity of the anthropotechnological reception context and thus misses half of the problem.

AI caricatures our views but also creates an image of them in which we look outward at our own subjectivities and thus navigate platitudes, clichés, and received ideas.

A common AI example is to generate an image of a doctor’s meeting: you get a meeting of male doctors, white doctors, CISgenre doctors, and so forth. But it is easy to alter these biases through a new alignment – and for example, to have ethnic proportions by country (and OpenAI is quick to do so because of the criticism). It is much more difficult to change these inequalities in reality since the training of a doctor takes a decade… The requirement to have a different meeting of doctors is also the requirement to have an image that does not correspond to the reality, even if it can be criticized. To give ourselves a desirable, ideal image in line with what we want.

Impatience with AI bias remains instrumental in substance and expresses the drive for power that determines technique. It obscures two other possibilities: AI biases allow us to observe and appreciate our own biases, and they provide a mirror to our reflexivity. On the other hand, these results are always read by humans, and they intersect their biases, their subjectivities, in resonance or dissonance, so that what AI produces is not the end of the story. She’s going on a circuit with us.

Criticism of AI bias often presupposes transparency, readability, neutrality and a desire to do away with subjectivity. It forgets that AI is a new way of reading human culture, however incomplete and oblivious it may be, and thus of interpreting it. In short, it sets aside the historical hermeneutics inherent in all reading, and delegates even further to AI’s automatisms what should constitute our faculty of reflexivity. Criticism, as is often the case, reproduces what it believes it is contesting. By staging AI’s power of truth, it institutes it. At the same time, it obscures AI’s non-human finitude,, imperfection, perfectibility and interpretative heteronomy.