Angèle et l’art.ificiel – AOC
La reprise des clones
En août, un producteur basé à Nancy, Lnkhey, publie sur SoundCloud et YouTube1 un remix où la voix clonée d’Angèle, grâce au logiciel libre Retrieval-based-Voice-Conversion2, chante un morceau qu’elle n’a jamais interprétée. Plusieurs millions de personnes l’écoutent. Angèle réagit sur Tik Tok : « je ne sais pas quoi penser de l’intelligence artificielle, jtrouve c’est une dinguerie, mais en meme temps jai peur pour mon metier mdrrrrr » 3. Sur cette vidéo, elle chante en play-back ce remix puis fait une moue amusée comme si elle était prise de vertige face à cette voix ressemblante qui n’est pas la sienne. Après de nombreuses demandes sur les réseaux, le dimanche 17 septembre, à la Fête de l’Humanité, elle interprète enfin « Saiyan » de Gazo et Heuss l’Enfoiré :
« Elle a les cheveux dorés et la peau bien bronzée
Elle boit du Daïquiri, elle m’appelle “ma chérie”
On va pas finir l’année, on va se séparer
Sur moi, t’as tout misé, mais j’suis qu’une enfoirée »
La seule différence est la féminisation des paroles et le trouble de genre que celle-ci implique lié au coming out forcé à la fin 2019 et au fait que dans le remix de Lnkhey, c’était la voix masculine de celui-ci qui est transformée en celle d’Angèle. Tout se passe, dans ces paroles, comme si Angèle se dédoublait et se regardait du dehors puisqu’elle a aussi « les cheveux dorés ». Le public est enthousiaste et reprend en cœur les paroles tout en tendant à bout de bras leur téléphone pour immortaliser ce moment. Immédiatement, c’est une traînée de poudre sur les réseaux. @adlan_mzn poste : « POV : quand l’IA d’Angèle sur Saiyan devient enfin réalité ». Quel est ce morceau qui « devient enfin réalité » ? Qu’était-il avant de devenir, par l’interprétation d’Angèle, réel ? Quelle a été la nature de la demande insistante du public pour que cette interprétation ait lieu et que révèle-t-elle de la nouvelle culture de l’IA ?
Le jeu d’emboîtement de ce remix est vertigineux et son origine semble se perdre dans une zone grise où la distinction entre l’être humain et l’IA devient inconsistante. Car dès la première étape, Gazo et Heuss l’Enfoiré chantent avec Autotune, célèbre logiciel apparut au milieu des années 90, qui fut développé par Andy Hildebrand et qui permet de chanter juste quand on chante faux, de simuler une compétence vocale qui fut moquée jusqu’en 2010, époque où en poussant à l’extrême l’effet, celui-ci devint un véritable style teinté d’une sonorité métallique. Autotune signalait alors le simulacre de son origine artificiel et plutôt que d’être une correction, il devint une véritable culture plongeant ses racines dans le hip-hop des années 70 et 80 où des danseurs en mimant des mouvements mécaniques exprimaient leur talent humain. Quel était cet affect, avec un public complice, qui savait que des êtres humains simulaient des machines, retournant comme un gant et détournant le contrat implicite du test de Turing ?
Car il y a une remarquable intelligence, au sens de la complicité, dans ce simulacre de l’humain artificiel qui se reconnaît comme tel et qui jouit, dans un clin d’œil, de sa doublure technomorphique. Il y a une complicité spécifique entre l’artiste et son public de se savoir ainsi outillé, cloné, simulé. Et ce sentiment commun est encore décuplé dans le réseau complexe de ce remix qui du morceau original hanté par son artificialisation d’Autotune, par l’apprentissage de la voix d’Angèle grâce à 10 minutes d’échantillon, par Lnkhey qui chante et transforme sa voix grâce à RVC, par la publication, le succès public qui s’amuse d’un tel simulacre, la première réaction décalée d’Angèle puis son interprétation à la Fête de l’Huma, change profondément les modes de reproduction culturelle.
Andy Hildebrand, le créateur d’Autotune, était sismographe et travaillait dans l’industrie pétrolière où il étudiait les sols et réalisait des prédictions sismiques pour l’entreprise Exxon. Dans le cadre de son travail, il met au point une méthode basée sur l’autocorrélation, qui permet d’envoyer des ondes acoustiques dans les sous-sols pour voir si une exploitation pétrolifère est possible. C’est précisément cette technique qu’il va utiliser pour créer Autotune en 1995 où on envoie une voix et, comme s’il s’agissait de son écho, une autre voix nous est renvoyée. Or, le changement culturel d’Autotune ne consiste absolument pas en l’intention initiale de son programmeur qui restait instrumentale, c’est-à-dire dans le fait de chanter juste et te tuer les fausses notes, mais dans son détournement qui, quand on pousse l’effet à l’extrême, rend explicite son artificialité et créé une nouvelle esthétique où le simulacre est visible. Hildebrand explique qu’il n’avait « jamais imaginé que quelqu’un de sensé ferait cela » 4
L’angle mort du remplacement
Face à cette circulation des simulacres rendus sensibles où chaque agent semble joyeusement expérimenter son devenir machine, allant et venant entre la technique mimant l’être humain et l’être humain jouant à mimer la technique, pour construire un nouvel espace anthropotechnologique où se perd l’origine et où s’affirme les dépendances réciproques, le discours dominant reste à la crainte et à la volonté de régulation. La thèse d’une humanité remplacée semble s’étendre chaque jour, avec des modalités différentes selon le positionnement politique, et s’applique à l’ensemble des flux, c’est-à-dire à ce qui pourrait nous déborder et être hors de notre contrôle : du climat à l’énergie, de l’économie aux migrations, des virus à la technique, etc. C’est une précarité généralisée que chacun semble ainsi imaginer et dont il faudrait se défendre en construisant des protections tournées vers le dehors dans l’objectif de protéger l’autonomie d’une humanité fantasmée.
Si, emboîtant le pas des scénaristes, les 160 000 acteurs syndiqués au SAG-Aftra font grève à Hollywood, c’est pour deux raisons principales ayant trait à la question de la reprise : d’une part, ils demandent des droits sur la multidiffusion en streaming et non plus seulement sur la création originale, d’autre part des garanties quant à l’IA qui risquerait de les cloner ou de les remplacer. C’est donc là encore la question de la répétition et du simulacre qui sont en jeu, mais essayons, l’espace d’un instant, de plonger dans ce flux plutôt que de nous en extirper d’avance.
Imaginons un monde où chaque acteur aurait sa voix et son apparence clonées grâce aux technologies de deepfakes et où les figures humaines passées, de Marilyn à Dean, puissent être rejouées, encore et encore. Si on estime que le cinéma, héritier du photoréalisme, a été constitutif de notre réalisme au siècle dernier, on peut s’interroger sur cette transformation radicale de la représentation : non plus seulement un avoir-été qui revient dans la répétition de la pellicule, identique à lui-même, mais un avoir-été qui est repris, rejoué, réinterprété, réactualisé, renouvelé, bref une seconde fois qui est première. Cela n’affecterait pas seulement ces figures humaines, mais la constitution du temps lui-même qui par une telle résurrection, fort différente de la théologie chrétienne, nous ferait entrer dans un éternel retour du même, un éternel retour idiot et répétant la moyenne statistique, se distinguant de l’interprétation d’un éternel retour de la différence que Deleuze ou Klossowski avaient rendue pour ainsi dire canonique.
La mise au chômage des acteurs clônés et décomposés, puisqu’on peut déjà prendre la voix de l’un pour le mettre sur le visage de l’autre, où automatiquement la traduire dans n’importe quelle langue en la synchronisant avec le mouvement des lèvres5, serait bien sûr une accumulation plus grande du capital, mais ouvre aussi la voie à un monde difficilement imaginable où notre mémoire ne serait plus seulement accumulée sur des supports matériels, que Bernard Stiegler avait nommé rétentions tertiaires, mais statistiquement construites et ressuscitées comme dans le cas de cette « nouvelle » reprise des Beatles par Kurt Cobain6. Or ces supports matériels, qui sont la technique elle-même, déjà à l’époque industrielle, n’étaient pas simplement rajoutés aux rétentions primaires (ce qui se passe dans le présent de la conscience, par exemple une note de musique) et aux secondaires (ce dont nous nous souvenons et que nous avons sélectionné), mais surdéterminaient de part en part les deux précédentes et la possibilité même de la mémoire et des facultés transcendantales. L’IA est l’apparition d’une mémoire quaternaire qui se nourrit pour calculer leurs probabilités statistiques des tertiaires ayant atteintes, par les données massives du Web, leur apogée d’accumulation. Nous produisons des médias de médias, des textes de textes, des images d’images et cette reproduction n’est pas simplement instrumentale, elle change sa propre nature et notre réalisme. Serait-ce encore du cinéma quand les entités projetées à l’écran seront le fruit d’un calcul statistique, répétant d’abord des acteurs connus puis créant peut-être de nouvelles entités, à la manière de ces chanteuses virtuelles japonaises, aliénant jusqu’à notre humanisme, c’est-à-dire la reconnaissance de nos semblables ? La catharsis aristotélicienne nous permettant de nous identifier par projection se fera-t-elle encore par-delà la reconnaissance des formes organiques ?
Si le remplacement est conjuré, ce n’est pas seulement du fait de l’accumulation et de la concentration du capital, qui avec ou sans IA a lieu, mais bien parce que ce remplacement a un angle mort qui suppose que nous sachions à quoi nous avons affaire et ce que nous sommes. Si nous avons peur d’être remplacé c’est que nous croyons savoir ce qui est remplacé. Il s’agit d’une place évidée, la nôtre, et c’est pourquoi on peut estimer de ce point de vue que la conjuration du remplacement est, dans l’entièreté du spectre politique, homogène. Elle désigne la crainte d’une altérité parce que celle-ci attaque l’angle mort de celui qui l’énonce : la vacuité de sa propre position. Ceci est évident pour la xénophobie, mais doit être étendu à l’humanisme technocritique qui suppose toujours qu’on sait à quoi on a affaire en ce qui concerne l’être humain. Ainsi, quand on interdit l’usage de ChatGPT dans une école sous peine d’exclusion des élèves, on tente de préserver la position d’autorité de l’enseignant et le caractère normatif du travail demandé, même si celui-ci est aisément clonable.
Quand Bruno Le Maire, alors qu’il s’exprimait devant le Parlement européen le 22 mai 2023, explique qu’il faut placer un bandeau « Made in AI » sur les productions de Mid Journey ou ChatGPT, c’est au nom de la transparence, du signalement et de la traçabilité. Il faut qu’on sache qui a fait quoi. Est-ce de l’être humain ou de la machine ? Qu’est-ce qui est en nous et hors de nous ? Quelle est la frontière ? Mais que certains artistes aient pu douter, au seuil du XXe siècle, de cette attribution anthropologique de l’art, le ministre n’en a cure. Que Picabia, Duchamp, Ernst, à sa manière encore Turner, et tant d’autres, aient pu imaginer que la technique était infiniment plus trouble qu’un simple instrument au service de notre volonté (de puissance), et que l’art puisse être précisément le lieu où des machines rendues orphelines de l’humanité voient le jour, voilà ce que la conception commune méconnaît tant elle reste fidèle à l’idée de l’art construiet par Balzac, et du premier artiste représenté dans un roman, Frenhofer du Chef-d’œuvre inconnu (1831). La volonté d’attribution marque le désir de se réattribuer une intériorité subjective au moment où celle-ci constitue et est constituée par l’extériorité technique et est structurellement aliénée. C’est un lieu commun que de dire qu’on n’écrit pas à la plume comme sur une machine à écrire, sur une telle machine comme sur un clavier d’ordinateur, que la répétition manuscrite où on devait réécrire et faire des repentirs de version en version à la main ne pense pas dans la même temporalité que quand on passe du brouillon à une version finale, en copiant et collant, sur Word ou Open Office. Bref, que les deux premières mémoires abordées par Stiegler sont travaillées par la troisième rétention et qu’à notre sens, ces trois mémoires commencent à être emboîtées dans la quatrième mémoire, celle de l’IA et de l’induction statistique : quand j’écris un texte avec ChatGPT ce n’est ni un texte original ni la simple répétition et synthèse des textes qui ont alimenté le réseau de neurones, c’est tout à la fois, tout comme ce présent texte est singulier, mais est la mémoire, et la répétition, de tout ce que j’ai lu.
La culture de l’espace latent
Lundi soir, j’ai donc regardé en boucle Angèle reprendre une IA qui la clonait et Taylor Swift se déhancher sur « Paint the Town Red » de Doja Cat7, au moment où, à deux reprises, elle semble regarder la caméra et se sait filmée. Elle, la célébrité américaine, devient une auditrice, fait partie du public et dédouble celui-ci. Nous sommes devenus le second public complice de ce regard adressé, tout comme il existe aujourd’hui dans l’espace latent, c’est à dire dans l’ensemble des statistiques d’une IA, des médias de médias qui troublent leur paternité. Je n’ai pas pu m’empêcher de regarder ces deux séquences en boucle comme si elles portaient, chacune à leur manière, leur propre répétition, idiote et répétitive, compulsive.
Dans Tubes. La Philosophie dans le juke-box, Peter Szendy aborde le vers d’oreille, cette pulsion à écouter encore et encore le même morceau, et s’il fait d’Around the World des Daft Punk, le paradigme, cette chanson énonçant sa propre circulation planétaire, chaque auditeur devenant à sa manière le support de celle-ci, c’était à l’époque de la mondialisation néolibérale. Angèle marque un nouveau vers d’oreille à l’ère de l’espace latent de l’IA. Lorsque nous l’écoutons, nous entendons l’anthropotechnologie, c’est-à-dire la zone grise qui trouble la frontière entre l’être humain et la technique selon de multiples fils. Le vers d’oreille devient statistique : dans le vacillement de cette voix, humaine trop humaine, et qui à un moment rigole de l’inhumanité de cette reprise, nous entendons la manière dont l’art n’est nullement l’extériorisation d’un génie humain dans une matière, une forme et un usage déterminés, mais est la rencontre égarante avec une matière que celle-ci soit technologiquement organisée ou pas. L’être humain invente la technique et, au sens strict, Angèle est inventée par une technique qui la clone.
L’espace latent est notre nouvel espace culturel dont les produits sont contrefactuels. La chanson d’Angèle existait avant d’exister réellement, elle existait comme une statistique ou, selon les cas, un possible. Il a fallu qu’elle naisse à la réalité par cette reprise de reprise. C’est la signification ontologique du post déjà cité : « Quand l’IA d’Angèle sur Saiyan devient enfin réalité » où le « de » qui sépare et relie l’IA à Angèle exprime cette prétérition du latent culturel. Tout existe avant d’exister. Il y a dans cette étrange anticipation contrefactuelle, un nouveau pacte complice avec le public. C’est Kaaris s’amusant de sa propre IA8 et ce n’est nullement là la propriété d’un possible remplacement, c’est la distance à soi, une étrangeté bien connue de la modernité, décalage de notre appareillage. Grâce à l’accumulation du passé par les supports matériels de mémoires tertiaires, nous produisons quelque chose qui n’avait jamais eu lieu, mais qui ressemble étrangement à tout ce qui pourrait avoir lieu : Kaaris chantant l’Inspecteur Gadget ou un animé de Disney. Ce possible a déjà sa forme de réalité, mais toute l’intelligence culturelle de notre époque est dans cet amusement partagé entre les chanteur.se.s et le public, dans cette nouvelle répétition où nous interprétons ce possible qui a déjà eu lieu.
Si notre culture, et son partage, étaient déterminés par les mémoires tertiaires, fruit de la période industrielle, nous entrons assurément dans une nouvelle époque avec les mémoires quaternaires où le contrat esthétique pourrait être celui de l’aliénation : nous reproduisons des machines qui nous reproduisent. L’espace latent devient un espace des possibles qui contient le passé, mais aussi, sans doute, une partie de l’avenir et de l’incalculable. Car on pourrait bien, par exemple, faire une photographie avec un appareil quelconque et l’envoyer dans une IA pour vérifier qu’elle existe déjà et la trouver, la retrouver. Il ne s’agit plus seulement du numérique qui rendait discret, sous forme de 0 et 1, des variations analogiques, qui les découpaient, il s’agit à présent de possibilités statistiques, qui n’existent pas (encore). Cette latence devrait bien sûr être liée au complotisme, aux fausses nouvelles, à cette étrange démocratisation expressive de l’opinion où tout le pensable semble devoir être pensé par quelqu’un et où chacun semble ne penser que pour réagir à ce qu’il croit que l’autre pense dans une anticipation bayésienne sans fond.
Nous avons encore à nous orienter dans cette culture de l’espace latent et dans l’émotion paradoxale qui nous saisit peut être lorsque nous écoutons, et réécoutons, la voix d’Angèle, puis que nous revenons à la voix de l’IA, que nous allons et venons entre les deux, ne sachant décider de notre émotion et du monde qui ainsi nous traverse. C’est un nouveau réalisme et nouvelle historicité sans doute, de nouvelles structures qui émergent.
La boucle est bouclée
Face aux discours omniprésents et étouffants du remplacement, Angèle et son public jouent une autre partie. Les sentiments y sont mêlés. Il y a sans doute un peu de peur, d’étonnement, mais surtout un amusement dans le jeu infini des simulacres et des ressemblances, autre nom pour désigner la culture, ce que n’auront jamais compris les pasteurs technocritiques et les prêtres humanistes. L’IA n’y est pas pensée d’avance, comme s’il suffisait de la réfléchir correctement pour fixer la manière dont il faut la réformer, l’encadrer, la mettre dans un tuyau, avec une entrée et une sortie, des embranchements, toute une logistique qui est finalement un logos et qui aura toujours un coup de retard. L’IA y est expérimentée, nous l’aliénons et elle nous aliène. Dans ce cas, elle a bien appris à chanter comme Angèle et cette dernière lui a en quelque sorte répondu en la reprenant. Nous avons été les secrets témoins de cet écho sismique.
Après l’apogée de l’accumulation hypermnésique des supports de mémoire par leur numérisation et leur enregistrement dans les centres de données, ultime étape de la reproductibilité benjaminienne, nous industrialisons avec l’IA la ressemblance elle-même par le possible. C’est sans doute la raison pour laquelle l’IA, cette question qui traverse et bouleverse bien des domaines de l’activité humaine, a été abordée principalement dans les médias et auprès du grand public par la question de l’art. Cette dernière concentre en effet symboliquement dans la modernité le propre de l’humanité, le mystère de son intériorité qui, nous le savons, fut le procès d’une construction de la subjectivité en Occident, allant jusqu’à la volonté de puissance et le nihilisme.
Dans un autre post de Tik Tok, on peut lire « La boucle est bouclée ». Ce n’est pas seulement que nous apprenons aux IA à créer des images, des textes et des sons qui nous ressemblent, c’est que nous leur ressemblons et que par rapport aux discours réactionnaires, nous ne désirons rien d’autre que d’activement nous aliéner. Nous ne croyons ni dans le fait de rendre lisible les IA par la transparence du code, ni dans l’acte de couper et nous séparer de ces flux pour regagner une imaginaire autonomie et souveraineté. Nous voulons expérimenter que ce que nous croyons être est aussi un produit de la technique et de sa reproduction paradoxale. Nous en sommes la reprise. L’IA, quant à elle, métabolisant toute l’histoire de nos supports de mémoire, est en train de constituer une nouvelle mémoire où le passé et le futur ne sont plus chronologiques, mais semblent se répondre l’un à l’autre en échangeant leur rôle.
The Cloning Revival
In August, a producer based in Nancy, Lnkhey, released a remix on SoundCloud and YouTube1 where Angèle’s cloned voice, thanks to the open-source software Retrieval-based-Voice-Conversion2, sang a song she had never performed. Several million people listened to it. Angèle reacted on TikTok: ‘I don’t know what to think about artificial intelligence, I find it crazy, but at the same time, I’m scared for my job lol.’ On this video, she lip-syncs to this remix and makes an amused face as if she were dizzy in the face of this similar voice that is not hers. After numerous requests on social media, on Sunday, September 17th, at the Fête de l’Humanité, she finally performed ‘Saiyan’ by Gazo and Heuss l’Enfoiré:
‘She has golden hair and a nice tan She drinks Daiquiris, she calls me “my dear” We won’t make it to the end of the year, we’ll break up You bet everything on me, but I’m just a jerk.’
The only difference is the feminization of the lyrics and the gender ambiguity it implies, related to the forced coming out in late 2019 and the fact that in Lnkhey’s remix, it was his own male voice that was transformed into Angèle’s. In these lyrics, everything happens as if Angèle were doubling herself and looking at herself from the outside, since she also has ‘golden hair.’ The audience is enthusiastic and sings along with the lyrics while holding their phones at arm’s length to immortalize the moment. Immediately, it becomes a wildfire on social networks. @adlan_mzn posts: ‘POV: when Angèle’s AI on Saiyan finally becomes a reality.’ What is this song that ‘finally becomes a reality’? What was it before becoming real through Angèle’s interpretation? What was the nature of the insistent demand from the public for this interpretation to take place, and what does it reveal about the new culture of AI?
The nesting game of this remix is dizzying, and its origin seems to be lost in a gray area where the distinction between the human and AI becomes inconsistent. Because from the very beginning, Gazo and Heuss l’Enfoiré sing with Autotune, a famous software that emerged in the mid-1990s, developed by Andy Hildebrand, which allows one to sing in tune when singing out of tune, simulating vocal competence that was mocked until 2010, a time when, by pushing the effect to the extreme, it became a true style with a metallic sound. Autotune then signaled the simulation of its artificial origin, rather than being a correction, it became a true culture rooted in the hip-hop of the 1970s and 80s, where dancers mimicked mechanical movements to express their human talent. What affect was at play here, with a complicit audience that knew that human beings were simulating machines, overturning and diverting the implicit Turing test contract?
Because there is remarkable intelligence, in terms of complicity, in this simulation of artificial humans who recognize themselves as such and who enjoy, in a wink, their technomorphic duality. There is a specific complicity between the artist and their audience in knowing that they are thus tooled, cloned, simulated. And this common feeling is further intensified in the complex network of this remix, which, from the original piece haunted by Autotune’s artificialization, to the learning of Angèle’s voice through a 10-minute sample, to Lnkhey singing and transforming his voice with RVC, to the publication, public success that enjoys such a simulacrum, Angèle’s initial quirky reaction, and then her interpretation at the Fête de l’Humanité, profoundly changes the modes of cultural reproduction.
Andy Hildebrand, the creator of Autotune, was a seismographer and worked in the oil industry, where he studied the earth’s crust and made seismic predictions for Exxon. In the course of his work, he developed a method based on autocorrelation, which allowed sending acoustic waves into the ground to determine if oil exploitation was possible. It is precisely this technique that he used to create Autotune in 1995, where you send one voice, and, as if it were its echo, another voice is returned to us. However, the cultural shift brought about by Autotune does not at all lie in its programmer’s initial intention, which remained instrumental, i.e., in making singing in tune and eliminating off-key notes. Instead, it lies in its subversion, where when you push the effect to the extreme, it makes its artificiality explicit and creates a new aesthetic where the simulacrum is visible. Hildebrand explains that he had ‘never imagined that anyone sensible would do this.’
The Blind Spot of Replacement
Faced with the circulation of rendered simulacra, where each agent seems to joyfully experience its becoming a machine, going back and forth between the technology imitating the human and the human playing at imitating the technology, to build a new anthropotechnological space where the origin is lost and reciprocal dependencies are affirmed, the dominant discourse remains one of fear and the desire for regulation. The thesis of humanity being replaced seems to expand every day, with different modalities depending on the political stance, applying to all flows, i.e., to what could overflow us and be beyond our control: from climate to energy, from the economy to migration, from viruses to technology, etc. It’s a generalized precarity that everyone seems to imagine, and one that needs to be defended against by constructing outward-facing protections to preserve the autonomy of a fantasized humanity.
If, following in the footsteps of scriptwriters, the 160,000 members of the SAG-AFTRA actors’ union go on strike in Hollywood, it’s for two main reasons related to the question of reproduction: on the one hand, they demand rights for streaming re-broadcasting, not just for original content, and on the other hand, they seek guarantees regarding AI, which could clone or replace them. So, once again, the question of repetition and simulacrum is at stake. But let’s try, for a moment, to immerse ourselves in this flow rather than trying to escape from it in advance.
Let’s imagine a world where every actor has their voice and appearance cloned using deepfake technology, and where past human figures, from Marilyn to Dean, can be replayed over and over again. If we consider that cinema, as the heir of photorealism, was constitutive of our realism in the last century, we can question this radical transformation of representation: not just a past that returns in the repetition of celluloid, identical to itself, but a past that is replayed, restaged, reinterpreted, updated, renewed, in short, a second time that is first. This wouldn’t only affect these human figures but also the very concept of time, which, through such resurrection, unlike Christian theology, would lead us into an eternal return of the same, an idiotic and repetitive eternal return, departing from the interpretation of an eternal return of difference as Deleuze or Klossowski made it almost canonical.
The unemployment of cloned and deconstructed actors, since we can already take one’s voice and put it on another’s face or automatically translate it into any language by syncing it with lip movements5, would, of course, be a greater accumulation of capital. But it also opens the door to an unimaginable world where our memory is no longer accumulated only on material media, as Bernard Stiegler called tertiary retentions, but statistically constructed and resurrected, as in the case of this “new” Beatles cover by Kurt Cobain6. However, these material media, which are the technique itself, even in the industrial age, were not simply added to primary retentions (what happens in the present of consciousness, for example, a musical note) and secondary retentions (what we remember and select), but overdetermined both of them and the very possibility of memory and transcendental faculties. AI is the emergence of a quaternary memory that feeds on tertiary ones, which have reached their peak of accumulation through the massive data of the Web, to calculate their statistical probabilities. We produce media of media, texts of texts, images of images, and this reproduction is not merely instrumental; it changes its own nature and our realism. Will it still be cinema when the entities projected on the screen are the result of statistical calculation, first repeating known actors and perhaps creating new entities, similar to those virtual Japanese singers, alienating even our humanism, which is the recognition of our fellow beings? Will Aristotelian catharsis, allowing us to identify through projection, still take place beyond the recognition of organic forms?
If replacement is conjured, it is not only due to the accumulation and concentration of capital, which happens with or without AI, but because this replacement has a blind spot that assumes we know what is being replaced. It’s an emptied place, our own, and from this perspective, we can consider that the conjuring of replacement is homogeneous across the entire political spectrum. It denotes the fear of alterity because it attacks the blind spot of the one who pronounces it: the emptiness of their own position. This is obvious for xenophobia but should be extended to technocritical humanism, which always assumes that we know what we’re dealing with regarding the human being. So, when ChatGPT is prohibited from use in a school with the threat of student exclusion, an attempt is made to preserve the teacher’s authority and the normative nature of the work required, even though it is easily clonable.
When Bruno Le Maire, while speaking before the European Parliament on May 22, 2023, suggests placing a ‘Made in AI’ label on productions by Mid Journey or ChatGPT, it’s in the name of transparency, signaling, and traceability. We need to know who did what. Is it human or machine? What is inside us and outside of us? Where is the boundary? But the minister doesn’t care about the fact that some artists, at the turn of the 20th century, might have doubted this anthropological attribution of art, believing that technology was far more complex than a mere instrument at the service of our will (of power), and that art could be precisely where machines, orphaned of humanity, come to life. This common conception ignores how unsettling technology can be and how it structurally alienates us. It’s a common saying that writing with a quill is not the same as writing on a typewriter, and typing on such a machine is different from using a computer keyboard, just as the manual repetition where you had to rewrite and make revisions by hand in multiple versions doesn’t think in the same temporality as when you move from a draft to a final version, copying and pasting in Word or Open Office. In short, these first two memories addressed by Stiegler are worked on by the third retention, and in our opinion, these three memories are beginning to be nested in the fourth memory, that of AI and statistical induction: when I write a text with ChatGPT, it’s neither an original text nor a simple repetition and synthesis of the texts that fed the neural network; it’s all of these at once, just as this present text is unique but is the memory and repetition of everything I’ve read.
The Culture of Latent Space
So, on Monday evening, I watched Angèle loop back an AI that was cloning her, and Taylor Swift grooving to Doja Cat’s ‘Paint the Town Red,’ at the moment when, on two occasions, she seems to look at the camera and knows she’s being filmed. She, the American celebrity, becomes an audience member, becomes part of the audience, and duplicates it. We have become the second complicit audience for this gaze, just as there exists today in the latent space, that is, in the entirety of an AI’s statistics, media within media that blur their parentage. I couldn’t help but watch these two sequences on a loop as if they carried, each in its own way, their own repetition, idiotic and repetitive, compulsive.
In ‘Tubes: A Journey to the Center of the Internet,’ Peter Szendy addresses the ‘earworm,’ that compulsion to listen to the same song over and over again, and if he makes Daft Punk’s ‘Around the World’ the paradigm, this song announcing its own planetary circulation, with each listener becoming in their own way its medium, it was during the era of neoliberal globalization. Angèle marks a new earworm in the era of AI’s latent space. When we listen to her, we hear anthropotechnology, which is to say, the gray area that blurs the boundary between human and technique along multiple threads. The earworm becomes statistical: in the wavering of this voice, human all too human, and at one point, laughing at the inhumanity of this cover, we hear how art is by no means the externalization of human genius into a determined material, form, and use, but is the bewildering encounter with a material, whether technologically organized or not. Human invents technology, and, in the strict sense, Angèle is invented by a technology that clones her.
The latent space is our new cultural space whose products are counterfactual. Angèle’s song existed before it actually existed; it existed as a statistic or, in some cases, a possibility. It had to be brought into reality through this cover of a cover. This is the ontological meaning of the aforementioned post: ‘When Angèle’s AI on Saiyan finally becomes a reality,’ where the ‘of’ that separates and connects the AI to Angèle expresses this preterition of cultural latency. Everything exists before it exists. In this strange counterfactual anticipation, there is a new complicit pact with the audience. It’s Kaaris having fun with his own AI, and this is by no means the ownership of possible replacement; it’s the distance from oneself, a strangeness well known in modernity, a gap in our apparatus. Thanks to the accumulation of the past through tertiary memory supports, we produce something that had never happened before but strangely resembles everything that could happen: Kaaris singing ‘Inspector Gadget’ or a Disney animation. This possibility already has its form of reality, but all the cultural intelligence of our time lies in this shared amusement between the singers and the audience, in this new repetition where we interpret this possibility that has already occurred.
If our culture and its sharing were determined by tertiary memories, the result of the industrial age, we are undoubtedly entering a new era with quaternary memories, where the aesthetic contract could be one of alienation: we reproduce machines that reproduce us. The latent space becomes a space of possibilities that contains the past, but also, perhaps, a part of the future and the incalculable. For example, one could take a photograph with any device and send it to an AI to check if it already exists and find it, rediscover it. It is no longer just about the digital that made analog variations discreet, cut them up into 0s and 1s; it is now about statistical possibilities that do not (yet) exist. This latency should, of course, be linked to conspiracy theories, fake news, to this strange expressive democratization of opinion where everything thinkable seems to have to be thought by someone, and where everyone seems to think only to react to what they believe the other thinks in a Bayesian anticipation without end.
We still have to navigate in this culture of the latent space and the paradoxical emotion that may seize us when we listen and re-listen to Angèle’s voice, then return to the AI’s voice, going back and forth between the two, unable to decide our emotion and the world that thus traverses us. It’s probably a new realism and a new historicity, new structures emerging.
The loop is closed
Faced with the omnipresent and suffocating discourse of replacement, Angèle and her audience play another game. Emotions are mixed in there. There is probably a bit of fear, amazement, but above all, amusement in the infinite play of simulacra and resemblances, another name for culture, which the techno-critical shepherds and humanist priests will never understand. AI is not thought of in advance here, as if it were enough to think it correctly to determine how it should be reformed, regulated, put in a pipe, with an input and an output, branches, a whole logistics that is ultimately a logos and will always be one step behind. AI is experimented with here; we alienate it, and it alienates us. In this case, it has learned to sing like Angèle, and she, in a way, responded to it by covering it. We were the secret witnesses to this seismic echo.
After the peak of hypermnesic accumulation of memory media through digitization and storage in data centers, the ultimate step in Benjaminian reproducibility, we are industrializing with AI the resemblance itself through possibility. This is probably why AI, this question that traverses and disrupts many domains of human activity, has been mainly addressed in the media and with the general public through the question of art. The latter symbolically concentrates in modernity the essence of humanity, the mystery of its interiority, which we know was the process of constructing subjectivity in the West, going so far as to will to power and nihilism.
In another TikTok post, you can read, ‘The loop is closed.’ It’s not just that we teach AIs to create images, texts, and sounds that resemble us; it’s that we resemble them, and in contrast to reactionary discourses, we desire nothing more than to actively alienate ourselves. We do not believe in making AIs legible through code transparency, nor in the act of cutting and separating from these flows to regain an imaginary autonomy and sovereignty. We want to experience that what we believe to be is also a product of technology and its paradoxical reproduction. We are its cover. AI, metabolizing all the history of our memory supports, is forming a new memory where the past and the future are no longer chronological but seem to respond to each other by exchanging their roles.
1 https://www.youtube.com/watch?v=EiV1YxtbfcE
2 https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/fr/README.fr.md
3 https://www.tiktok.com/@angele_vl/video/7265090543191936288
4 https://archive.wikiwix.com/cache/index2.php?url=http%3A%2F%2Fwww.greenroom.fr%2F97340-le-jour-ou-un-sismologue-a-invente-lauto-tune%2F%23pmp5tPrx7yt4URpS.97#federation=archive.wikiwix.com&tab=url
5 https://twitter.com/mrjonfinger/status/1701075571630047525
6 https://www.youtube.com/watch?v=T-JRBib-FjA
7 https://www.tiktok.com/@sweetmelodies._/video/7279126000309472544