Pizza-chien et contrefactualité des possibles
Je regarde cette pizza-chien depuis un moment. Elle circule sur les réseaux depuis quelques jours, depuis que Google a publié ses premières images issues de DeepDream, et je n’arrive pas à déterminer si elle m’amuse ou m’inquiète, ou si ces deux sentiments sont en train de se confondre en quelque chose que je n’ai pas encore de mot pour nommer. Ce qui est certain, c’est qu’elle me retient. Et je me méfie un peu de cette rétention, parce que je sais que je suis exactement le public visé par ce genre d’image, quelqu’un qui a passé des années à chercher dans le numérique autre chose que ce qu’il offrait ordinairement, et que ma fascination n’est peut-être pas une réponse à quelque chose de réel mais la satisfaction d’une attente que j’avais construite moi-même sans m’en rendre compte.
Cela dit, je crois que quelque chose se passe vraiment. Quand je regarde ce qui m’a intéressé dans le numérique depuis le début, je vois une série de tentatives de comprendre ce que la machine fait à l’image. La discrétion des pixels, le glitch, la synthèse en trois dimensions avec ses surfaces parfaites et froides comme des objets platoniciens, des formes sans histoire : rien de tout cela ne m’avait vraiment convaincu. Ces esthétiques travaillaient autour de la machine, elles en exhibaient les effets ou les ratés, mais elles ne touchaient pas à quelque chose de plus profond, à savoir la possibilité que la machine vienne habiter l’image de l’intérieur, qu’elle l’infecte, qu’elle y introduise sa propre logique comme un corps étranger qui ne serait plus tout à fait étranger. Le Web m’avait semblé plus proche de cette transformation de l’archive et de la mémoire, peut être n’était-ce qu’une étape préparatoire.
DeepDream fait cela. Pas encore complètement. Le photoréalisme reste hors de portée et les images produites gardent quelque chose de brouillon, de provisoire. Mais c’est précisément dans cette imperfection que quelque chose d’étrange se dessine, quelque chose qui ne ressemble à rien de ce que nous avons produit avant.
Ce qui se passe dans ces images est double et les deux niveaux sont inséparables. D’un côté, la machine projette sur une image des formes qu’elle a apprises à reconnaître dans d’autres images. Elle cherche des chiens dans une pizza, des yeux dans des nuages, des visages dans des façades d’immeubles. C’est de la pareidolie, ce mécanisme ancien par lequel la perception humaine trouve du familier dans l’informe. Sauf que là, la pareidolie est algorithmique, elle est systématisée et amplifiée à chaque itération jusqu’à ce que ce que la machine croit voir finisse par apparaître effectivement dans l’image, comme si la croyance suffisait à produire la réalité qu’elle anticipe.
De l’autre côté, ces images ressemblent fabuleusement à une hallucination sous LSD. Pas vaguement, pas par métaphore approximative. De manière précise, reconnaissable. Est-ce voulu ? La question mérite qu’on s’y arrête plutôt que de la laisser ouverte. Les ingénieurs qui ont travaillé sur ce programme évoluent dans une Silicon Valley dont la culture est largement constituée par l’héritage des années 1960, par les expériences avec les psychédéliques, par l’idée que modifier la perception est une façon de modifier la réalité. Stewart Brand, qui a lancé le Whole Earth Catalog en 1968 et qui a contribué à définir l’idéologie de ce milieu, disait que les ordinateurs personnels étaient les LSD des années 1980, un outil de libération de la conscience individuelle. Cette filiation n’est pas anecdotique. Elle signifie que la représentation de la machine comme productrice d’états altérés n’est pas un accident mais une façon de voir la technologie qui s’est transmise de génération en génération dans ce milieu particulier. Quand DeepDream produit des images qui ressemblent à des hallucinations, il actualise une vieille promesse de la contre-culture californienne, celle d’une machine qui ne calcule pas mais qui rêve, qui ne traite pas de l’information mais qui transforme la perception. Que cela soit entièrement conscient de la part de ses créateurs ou qu’il s’agisse d’un héritage intégré sans réflexion explicite ne change pas grand-chose. La ressemblance est là, et elle a une histoire.
Ce qui m’importe davantage, c’est ce que cette ressemblance dit sur le statut de ces images. Ce sont des images d’images. Pas des représentations du monde, pas des captures d’une réalité extérieure, mais des images qui se sont nourries d’autres images, qui ont intégré dans leur structure la mémoire d’un corpus visuel immense, et qui produisent à partir de cette mémoire accumulée quelque chose de nouveau et d’instable. Ernst Cassirer décrivait les Formes Symboliques comme les grandes structures par lesquelles l’humanité organise son rapport au monde, le mythe, le langage, la science, l’art. Ces formes ne sont pas des représentations au sens ordinaire du terme, elles sont des modes d’organisation de l’expérience qui ont leur propre logique, leur propre temporalité. Ce qui se passe avec DeepDream ressemble à une automatisation de cette idée. Comme si les formes symboliques que nous avons accumulées sur le réseau depuis vingt ans, toutes ces images de chiens et de pizzas et de visages et de paysages, étaient en train d’être retraitées par une machine qui en extrait une grammaire et la projette sur n’importe quelle surface.
La croyance en l’image en sort déstabilisée. Pas parce que ces images sont fausses au sens ordinaire du terme. Mais parce qu’elles superposent dans notre perception plusieurs régimes à la fois, l’indiciel et l’hallucinatoire, la trace et la projection, le souvenir et l’invention. On ne sait plus si on voit ce qui est là ou ce que la machine a décidé d’y voir. Et peut-être que cette incertitude existait depuis toujours dans notre rapport aux images, peut-être que nous n’avons fait que croire que les photographies montraient la réalité parce que personne ne nous avait encore fourni d’images qui exhibaient aussi clairement le mécanisme de la projection.
Comment vont évoluer ces images dans les années qui viennent ? Je me pose la question sérieusement, sans pouvoir y répondre. Resteront-elles dans cet espace de l’hallucination visible, de l’instabilité revendiquée, ou bien le processus sera-t-il affiné jusqu’à produire quelque chose d’indiscernable d’une photographie ordinaire ? Si la deuxième option se réalise, alors quelque chose change radicalement. Ce ne sera plus seulement la croyance en l’image qui sera déstabilisée. Ce sera la notion même de réalisme photographique, cette confiance implicite dans le fait qu’une image a forcément un référent quelque part dans le monde, qu’elle documente quelque chose qui a eu lieu. Nous verrons toutes les images, indicielles ou inductives, comme des images potentiellement produites par des machines. Ce seront des images contrefactuelles qui ressembleront aux images photographiques mais qui n’auront jamais été prises, seulement apprises et vectorisées. Je fais l’hypothèse que cette contrefactualité ouvre un réalisme du possible qui « documente » ce qui aurait pu avoir lieu ou ce qui pourrait avoir lieu. J’avoue que depuis mes années d’études, je suis attiré par ce concept de possible et que je n’ai cessé de réfuter la notion de virtuel. La distinction n’est pas terminologique. Le virtuel, au sens deleuzien du terme, désigne ce qui est réel sans être actuel, une potentialité qui attend ses conditions de réalisation, comme une graine contient déjà l’arbre sans l’être encore. C’est une notion qui conserve une logique de l’origine et du déploiement, quelque chose qui se réalise à partir d’une essence préexistante. Le possible fonctionne autrement. Il n’est pas en attente de réalisation, il est latéral, il coexiste avec ce qui a eu lieu sans en dériver. Deux événements possibles peuvent être également cohérents avec le même passé sans qu’aucun des deux soit plus virtellement contenu dans ce passé que l’autre. Ce que DeepDream produit n’est pas du virtuel en ce sens, ce n’est pas une image qui attendait d’être révélée dans le corpus dont elle est issue. C’est une image possible, une image qui est cohérente avec ce corpus sans en être la conséquence nécessaire, sans que quiconque l’ait jamais vue ou anticipée. Elle n’était pas là en puissance. Elle est là par vraisemblance statistique. Et cette différence change tout à la façon dont on comprend ce que la machine fait, parce qu’elle signifie que la machine ne révèle pas, elle génère, et que ce qu’elle génère n’a pas de profondeur cachée à déchiffrer, seulement une surface cohérente à habiter ou non.
J’avais commencé à travailler sur cette question l’année dernière avec Memories Center : The Dreaminbg Machine, une installation dans laquelle une machine génère de nouveaux rêves à partir d’une base de données de vingt mille rêves humains. Ce que je tentais de mettre en scène, c’était précisément cette idée d’une machine qui rêve les rêves humains, qui hallucine nos images à partir de ce que nous lui avons donné à mémoriser. DeepDream me semble aller dans la même direction, mais de manière plus radicale, parce qu’il ne s’appuie pas sur un corpus délimité et constitué intentionnellement. Il s’est nourri de ce que nous avons produit et mis en circulation sans y penser, de la totalité diffuse et incohérente de ce que l’humanité a photographié et téléchargé sur le réseau. Et il en extrait quelque chose qui ressemble à une culture, à un inconscient visuel collectif rendu visible par les itérations d’un algorithme.
C’est peut-être là la question la plus intéressante que ces images posent. Sommes-nous en train de passer d’un réalisme fondé sur la trace, sur le spectre du ça a été dont parlait Barthes, à quelque chose d’entièrement différent, un réalisme des possibles, un réalisme de tout ce qui n’a pas eu lieu mais qui ressemble tellement à tout ce que nous avons accumulé qu’il finit par avoir la même densité, le même poids de réel ? Si c’est le cas, alors la photographie comme art de la capture du présent n’est pas simplement complétée par un nouvel outil. Elle est remplacée par quelque chose qui fonctionne selon une logique opposée, non plus la saisie d’un moment particulier mais la génération d’un moment probable, statistiquement cohérent avec ce qui a existé sans être pour autant l’un de ces moments.
Ce qui va arriver à cette puissance de calcul, je le sais à peu près. Le capitalisme viendra l’utiliser, et ce n’est pas une observation morale, c’est un constat mécanique : toute technique qui permet de produire des images moins chères et plus nombreuses finit par être absorbée par les industries qui ont besoin d’images moins chères et plus nombreuses. La publicité, le divertissement, la pornographie. Le problème n’est pas l’appropriation en elle-même, toutes les techniques ont été appropriées. Le problème est que cette appropriation particulière risque de refermer très vite quelque chose que ces images viennent d’ouvrir. Si DeepDream devient un outil de production de contenu optimisé pour l’attention, il cessera d’être ce qu’il est aujourd’hui, un révélateur involontaire de la logique de perception de la machine. Il deviendra un miroir de nos propres désirs calibrés, et la distance qu’il introduit actuellement entre notre culture et notre regard sur elle disparaîtra.
C’est cette distance qui m’intéresse, pas comme valeur esthétique abstraite mais comme fait concret. La machine qui hallucine des chiens dans une pizza ne sait pas ce qu’est un chien. Elle sait que dans beaucoup d’images, cette configuration de pixels est associée à cette autre configuration de pixels. C’est tout. Et cette ignorance produit quelque chose d’étrange, presque de la tendresse, en tout cas de la distance. Nous regardons notre propre culture avec les yeux de quelque chose qui l’a entièrement mémorisée sans jamais l’avoir habitée. Ce n’est pas le regard d’une intelligence artificielle au sens des films de science-fiction. C’est quelque chose de plus modeste et de plus troublant, le regard d’une archive qui se met à voir.
Peut-être que cette pizza-chien ressemble aux images que produirait une espèce qui nous aurait succédé et qui tenterait de reconstituer ce que nous étions à partir de nos traces. Une espèce qui n’aurait pas accès à notre expérience du monde, seulement à ses représentations, et qui produirait à partir de là quelque chose de fidèle dans la forme et entièrement déplacé dans le sens. Je ne sais pas si cette image est consolante ou non. Je sais qu’elle est juste. Et je sais que mon imagination pour elle fait partie de ce qu’elle décrit, que je suis moi aussi en train d’halluciner quelque chose dans ces pixels, quelque chose qui dit peut-être plus sur ce que j’attends de la machine que sur ce qu’elle est réellement.