L’autre image
Ma machine calcule depuis 24 heures une série d’images. C’est Kim Novak qui vient hanter des films dans lesquels elle n’a pas joué, elle qui hantait Vertigo et qui se hantait dans son « propre » rôle de revenance.
Je ne peux nier le caractère fascinant de ces images qui évoluent d’heure en heure sur mon écran. Je les observe comme le flux d’une rivière s’écoulant, tumultueuse et tourbillonnante, irrégularités des détails se fondant dans l’écoulement général d’un paysage. La machine apprend à une image à être une autre image. À chaque cycle, le réseau de neurones affine un peu plus la ressemblance et je me mets à imaginer que toutes les images que nous avons créées, en particulier depuis l’accélération produite par l’industrialisation, n’ont été finalement que la constitution d’une mémoire à la disposition des machines pour produire toutes les (autres) images possibles. La cinémathèque comme stock de données (dataset) pour l’imagination artificielle ? Sera-t-il même nécessaire de faire de nouveaux films si les films passés peuvent servir aux machines afin de produire des images ? Quel est le statut de ces nouvelles images, fruit de la mémoire des images déjà existantes ? Ont-elles la nécessité ontologique des images filmées ou sont-elles de la contingence ?
Ce que Bernard Stiegler a nommé la quatrième synthèse, et qui concerne l’imagination transcendantale est déterminé par la mémoire technique. Elle s’articule aujourd’hui à l’automatisation de la mimésis par le deep learning. On peut souligner que cette automatisation est un bouleversement dans l’histoire de la représentation qu’on ne saurait simplement aligner à ce qui se faisait auparavant dans la génération automatique d’images. Jusqu’alors, l’art génératif produisait des images vectorielles proches du langage informatique. On pouvait bien générer des images 3D, mais on restait dans une conception morphologique de l’image. Il fallait implémenter un modèle de l’image, celui-ci fut-il aléatoire à différents degrés. Bref, il y avait une précompréhension programmée de ce qu’il fallait générer, de sorte que la génération restait platonicienne : l’idée, entendez le programme, était antérieure au résultat.
Internet a un peu troublé ce platonicisme de la génération. En s’ouvrant au réseau, on introduisait quelque chose qui excédait l’attente sous la forme des images qui apparaissaient. Cette mémoire des anonymes, multitudes dont les réseaux sociaux sont le réceptacle, n’appartenait déjà plus à l’idéalisme sous-jacent du code informatique. Il y avait là les matières désirantes.
Avec les réseaux récursifs de neurones, il en va encore autrement puisque le résulat (temporaire) est réintroduit dans la production. Tout se passe comme si la faculté de ressemblance était déléguée à la machine. Or cette faculté est précisément celle qui sert de fondement aux Formes idéales platoniciennes. Comment reconnaissons-nous une table dans les diversités inanticipables de ses formes et variations ? C’est que nous disposons, selon Platon, d’une Forme idéale antérieure qui rend possible cette reconnaissance. Mais la conception implicite des RNN nous apprend que cette faculté de représentation (Vorstellung) ne présuppose ni une Idée préalable ni une compréhension de l’être-au-monde et de l’en tant que tel du monde comme le pensait Heidegger, mais opère grâce une simple induction statistique. Quand je vois Kim Novak dans Vertigo devenir lentement Brigitte Bardot dans Le Mépris, j’observe bien la machine en train de créer des images qui n’existaient pas et qui sont à la jointure entre plusieurs images : le visage de Bardot prend la position de celui de Novak tout en gardant sa figure, c’est-à-dire sa reconnaissabilité. On sait bien que c’est Bardot, même si elle n’a jamais été filmée dans cette posture.
Depuis plusieurs années, des théoriciens se rêvent en grands éducateurs et ordonnateurs des images selon des stratégies différentes. Ils en appellent, tels Stiegler (en particulier avec le projet Lignes de temps) ou Debray, à une alphabétisation des images, puisque vivant en leur monde médial, nous devrions les rendre intelligibles afin de pouvoir nous les approprier et retrouver notre souveraineté. Ce désir de reconquête du sens, qui ramène l’image à l’écriture, reste en son fond platonicien et anti-artistique. Il présuppose que la signification se fonde sur elle-même, ce qui implique un sens fondatif. Il présuppose aussi qu’apprendre des images ce serait les ramener (de force) au langage. Or, ce que l’automatisation de la ressemblance des images nous permet de comprendre c’est qu’apprendre des images signifie d’une part le pouvoir d’en générer des nouvelles (c’est ce que nous nommons l’hyperproduction ou le surplus des possibles) et d’autre part que la signification est le produit d’une prédiction ou anticipation déficiente qui réintroduit sa marge d’erreur dans sa propre structure, cette marge étant irréductible. Apprendre des images c’est produire d’autres images et donc, par la ressemblance, laisser ouverte à jamais la série. L’absence de clôture de ces images est aussi l’absence fondative de « notre » souveraineté. Pour qu’il y ait ressemblance, ni les Formes idéales ni même le sens ne sont nécessaires. Kim Novak ne sera plus jamais elle-même. Elle ne l’avait jamais été.