From generation to generation

En suivant le fil des nouveautés dans le domaine des IA génératives, on est pris d’un sentiment de vestige devant l’obsolescence accélérée rendant toute production déjà passée. La course au photoréalisme semble sans fin. Les mises à jour se succèdent à un rythme effréné, parfois quotidien, transformant chaque création en archive avant même qu’elle n’ait eu le temps d’être pleinement explorée. Les développeurs se concentrent sur des améliorations techniques spécifiques : la qualité des textures, la précision des traits du visage, la cohérence anatomique, la gestion de la perspective. C’est sans doute que l’on conçoit chaque logiciel comme un élément séparé des précédents et des suivants, peinant à percevoir les lignées techniques. Face à ce vestige, certains sont déjà nostalgiques des GAN, de leurs métamorphoses indéterminées, de leur grain si particulier et de leurs formes extravagantes. Cette nostalgie s’exprime notamment dans la conservation et le partage d’anciennes versions des logiciels, dans la documentation minutieuse des résultats obtenus avec des versions spécifiques. L’obsolescence provoque aussi une nostalgie accélérée, un désir de se maintenir à un point du développement tout autant qu’une fascination gourmande de chaque nouveau logiciel.

Or le propre de ces logiciels c’est de pouvoir s’alimenter de leurs propres productions passées et de pouvoir les réinterpréter. Cette capacité d’auto-référencement constitue une caractéristique technique fondamentale qui permet d’établir une continuité historique dans leur développement. Les réseaux de neurones peuvent être entraînés sur des images qu’ils ont eux-mêmes générées, créant ainsi des boucles de rétroaction esthétiques. C’est pourquoi il est possible de percevoir et de travailler avec des lignées en alimentant des logiciels récents avec les productions de ceux plus anciens. Cette pratique permet de créer des ponts temporels entre différentes générations d’IA, révélant les évolutions subtiles des algorithmes.

La série Kiss, qui ne cesse de revenir sur une scène de Vertigo mettant en scène l’entièreté du film, est devenue le support de cette lignée : j’avais fourni à Zoetrope, le synopsis du film, transformant chaque ligne de celui-ci en un prompt pour chaque image extraite de la séquence. Ce processus de traduction entre le texte narratif et les instructions de génération d’images a créé un nouveau niveau d’interprétation algorithmique du film. Ceci avait produit une séquence métamorphique bien connue des années 2021-2022 que l’on peine à retrouver aujourd’hui. Les caractéristiques techniques de cette époque – le bruit particulier, les déformations spécifiques, les artefacts reconnaissables – constituent désormais des marqueurs temporels précis. Il a suffi de réinterpréter ces images avec un modèle actuel de diffusion, y hallucinant des détails inexistants, pour upgrader la séquence, mais surtout pour superposer deux méthodes de génération d’images, deux époques et esthétiques différentes. Cette superposition crée une stratification temporelle visible dans la texture même des images.

Le résultat garde des traces de 2022, comme un souvenir de ce que fut la génération. Ces traces se manifestent dans la structure profonde des images, dans leur grain, dans leurs imperfections caractéristiques. Car l’efficacité croissante des IA génératives a souvent un critère naïf d’alignement réaliste, leur faisant progressivement perdre leur inventivité hallucinée, leurs défauts et leurs si riches imperfections. Les nouveaux modèles tendent vers une standardisation esthétique qui privilégie la correction technique sur l’expressivité. Ainsi, si GPT-2 était capable de coécrire Internes (2019-2022), les LLM actuels peineraient à reconduire les visions de son espace latent parce qu’ils convergent vers un résultat de plus en plus normalisé. Les modèles récents produisent des textes plus cohérents mais moins surprenants, plus prévisibles dans leur structure. Il en est de même pour les images, qui perdent progressivement leurs qualités oniriques au profit d’une précision technique croissante.

C’est pourquoi, il peut être utile, plutôt que de passer d’un logiciel à un autre, courant après les dernières innovations et le rythme imposé par le consumérisme logiciel, de transformer des générations passées en une mémoire que l’on puisse réinterpréter, invoquant ainsi des lignées, des filiations et des brisures, faisant de ces logiciels leur propre mémoire. Cette approche permet de créer des œuvres qui portent en elles l’histoire de leur propre création, révélant les strates successives des technologies qui les ont façonnées.

C’est ainsi que l’innovation peut aussi être transformée en disnovation, gardant la mémoire (récente) de ses propres histoires, faisant de chaque image une sédimentation historique, invoquant les traces de ce qu’elle a été et des signes de ce qu’elle est en train de devenir. Cette sédimentation technique et esthétique crée des œuvres qui sont à la fois des documents historiques et des expérimentations contemporaines, témoignant des mutations rapides des technologies de génération d’images. Les imperfections et les caractéristiques distinctives de chaque génération d’IA deviennent des éléments expressifs à part entière, constituant une nouvelle forme de vocabulaire artistique qui s’enrichit de sa propre obsolescence.

As we keep up with the latest developments in generative AI, we are gripped by a sense of vestige, as accelerated obsolescence renders all production already passé.The race for photorealism seems endless.
Updates follow one another at a frenetic pace, sometimes on a daily basis, turning every creation into an archive before it has even had time to be fully explored. Developers focus on specific technical improvements: texture quality, facial feature precision, anatomical consistency, perspective management. This is undoubtedly due to the fact that each piece of software is conceived as a separate element from its predecessors and successors, struggling to perceive its technical lineage. Faced with this relic, some are already nostalgic for GAN, its indeterminate metamorphoses, its distinctive grain and extravagant shapes. This nostalgia is expressed in the preservation and sharing of old software versions, and in the meticulous documentation of results obtained with specific versions. Obsolescence also provokes accelerated nostalgia, a desire to hold on to a point in development as much as a greedy fascination with each new piece of software.And yet, the very essence of software is to be able to draw on its own past productions and reinterpret them. This capacity for self-referencing is a fundamental technical characteristic that establishes historical continuity in their development. Neural networks can be trained on images they themselves have generated, creating aesthetic feedback loops. This is why it is possible to perceive and work with lineages by feeding recent software with the productions of older ones. This practice creates temporal bridges between different generations of AI, revealing the subtle evolutions of algorithms.

The Kiss series, which constantly returns to a scene from Vertigo featuring the entire film, has become the medium for this lineage: I provided Zoetrope with the film’s synopsis, transforming each line of it into a prompt for each image extracted from the sequence. This process of translation between narrative text and image generation instructions created a new level of algorithmic interpretation of the film. This had produced a well-known metamorphic sequence from the years 2021-2022 that is hard to find today. The technical characteristics of this period – the particular noise, the specific distortions, the recognizable artifacts – now constitute precise temporal markers. All it took was to reinterpret these images with a current broadcasting model, hallucinating non-existent details, to upgrade the sequence, but above all to superimpose two different methods of image generation, two different eras and aesthetics. This superimposition creates a temporal stratification visible in the very texture of the images.

The result retains traces of 2022, like a memory of what the generation was like. These traces manifest themselves in the deep structure of the images, in their grain, in their characteristic imperfections. For the growing efficiency of generative AIs often has a naive criterion of realistic alignment, gradually causing them to lose their hallucinatory inventiveness, their flaws and their oh-so-rich imperfections. The new models tend towards an aesthetic standardization that prioritizes technical correctness over expressiveness. Thus, if GPT-2 were capable of co-writing Internes (2019-2022), current LLMs would struggle to reconcile the visions of its latent space because they converge towards an increasingly standardized result. Recent models produce texts that are more coherent but less surprising, more predictable in their structure. The same applies to images, which are gradually losing their dreamlike qualities in favor of increasing technical precision.

This is why it can be useful, rather than jumping from one piece of software to another, chasing the latest innovations and the pace imposed by software consumerism, to transform past generations into a memory that can be reinterpreted, thus invoking lineages, filiations and breaks, making these software programs their own memory. This approach makes it possible to create works that carry within them the history of their own creation, revealing the successive strata of technologies that have shaped them.

In this way, innovation can also be transformed into disnovation, retaining the (recent) memory of its own histories, making each image a historical sedimentation, invoking traces of what it has been and signs of what it is becoming. This technical and aesthetic sedimentation creates works that are both historical documents and contemporary experiments, bearing witness to the rapid mutations of image-generating technologies.The imperfections and distinctive features of each generation of AI become expressive elements in their own right, constituting a new form of artistic vocabulary that is enriched by its own obsolescence.