“Imagine something and just type it!”

09/2022

L’imagination artificielle et la transformation de la réflexivité

Une injonction

« Imagine something and just type it! » (« Imaginez quelque chose et tapez-le simplement ! »). Cette formule, repérée sur l’un des nombreux sites utilisant Stable Diffusion (https://getimg.ai), mérite qu’on s’y attarde. Loin d’être anodine, elle révèle la tournure que prend actuellement ce qu’on pourrait appeler l’« imagination artificielle » (ImA). Cette évolution ne représente pas une simple automatisation ou une extériorisation d’une faculté humaine, mais constitue un nouveau mode de réflexivité de l’imagination elle-même.

Cette phrase n’est pas une description technique d’un fonctionnement logiciel. Elle est une injonction adressée à un agent humain. Elle nous invite d’abord à imaginer « quelque chose ». Dans cette symptomatologie contemporaine, chaque mot revêt une importance particulière : ce qui est imaginé est sans contenu spécifique – seul importe l’acte d’imaginer. Selon cette logique, il suffirait de vouloir imaginer pour imaginer effectivement. La volonté précède donc l’imagination. Si l’on relit cette articulation à la lumière du débat sur l’imagination dans la Critique de la raison pure de Kant, dans ses deux éditions, on comprend que cette prédominance et cette antériorité de la volonté sur toutes les autres facultés posent un problème philosophique fondamental.

L’articulation entre image mentale et texte

Une fois ce « quelque chose » imaginé, l’injonction suggère qu’il suffirait de l’écrire. Cette proposition suppose non seulement que nous avons une connaissance claire de ce que nous avons imaginé, mais également que nous pouvons passer d’une image mentale à un texte sans difficulté et sans perte. En d’autres termes, le passage entre les deux registres serait garanti d’avance, afin que le logiciel puisse produire une image qui n’est plus mentale mais matérielle (car rappelons-le, l’image numérique est matérielle) et qui constituerait la reproduction fidèle de l’image mentale initiale.

On comprend alors que ce qui garantit cette extériorisation de l’image mentale sous forme d’image matérielle est l’injonction du texte nommé « prompt ». C’est parce que ce texte est supposé être la traduction à l’identique d’une représentation mentale qu’il devient possible, en sortie, de générer une image qui reproduit ce que nous avons dans l’esprit.

Pierre Cassou-Noguès, dans son ouvrage Lire le cerveau (2012), avait déconstruit de manière rigoureuse ce qu’il considérait comme la supercherie des lecteurs de cerveau (EEG) prétendant pouvoir lire la pensée. Cette déconstruction reposait sur plusieurs arguments :

La confusion entre états mentaux et états neuronaux
L’impasse faite sur un certain nombre de paradoxes, en particulier ceux concernant la pensée de la pensée

En effet, on ne peut vérifier la validité des lecteurs de cerveau qu’en demandant au sujet dont l’activité cérébrale est captée si, a posteriori, il y a bien correspondance entre la captation et ce qu’il a pensé. Or, nous ne pouvons jamais faire le compte exhaustif de notre pensée. Quand nous exprimons notre pensée, nous ne le faisons jamais directement; il y a toujours une « différance » (au sens du différé derridien) de la reprise réflexive : nous pensons que notre pensée était celle-ci ou celle-là.

Cette incertitude fondamentale affecte l’injonction présentée ici, qui établit une relation supposée transparente entre image mentale, écriture et image matérielle, dans le but de garantir que la première est identique à la troisième, qu’une image matérielle est l’expression fidèle de quelque chose que nous avons dans l’esprit.

Les racines historiques et philosophiques

Que ce soit l’écriture, comprise comme traduction sans perte et sans reste, transparente, de la pensée, qui soit chargée de cette opération, nous renvoie à des débats théologiques (cf. la question de la Genèse et du langage chez Gershom Scholem) et philosophiques qui peuvent sembler d’un classicisme peu à même d’approcher la nouveauté des réseaux de neurones artificiels. Pourtant, ces débats permettent d’en saisir l’enracinement historique, le fait que la situation présente vient actualiser, intensifier, radicaliser (au sens d’une arche instable) la manière dont, par exemple, la tradition platonicienne a essayé de garantir le passage des Idées dans le monde des ombres matérielles.

1. L’héritage platonicien

La tradition platonicienne a toujours cherché à établir un pont entre le monde intelligible des Idées et le monde sensible des apparences. Dans le Timée, Platon explique comment le démiurge façonne le monde matériel en prenant modèle sur les Idées éternelles. Cette relation entre modèle intelligible et copie sensible présuppose une certaine transparence, une possibilité de passage sans altération majeure d’un domaine à l’autre.

Dans la République, la célèbre allégorie de la caverne met en scène cette même problématique : les ombres projetées sur le mur ne sont que des copies imparfaites des objets réels, eux-mêmes copies des Idées. La question du passage entre ces différents niveaux de réalité, et de la fidélité de la reproduction, est au cœur de la métaphysique platonicienne.

L’injonction contemporaine « Imagine something and just type it! » s’inscrit, à sa manière, dans cette longue tradition. Elle présuppose que l’écriture (le texte du prompt) peut capturer fidèlement l’image mentale, et que l’algorithme peut ensuite matérialiser cette image sans perte significative. C’est une version technologique et accélérée du passage platonicien entre le monde des Idées et le monde sensible.

2. La question kantienne de l’imagination

La philosophie kantienne offre un autre cadre pour comprendre les enjeux de l’imagination artificielle. Dans la Critique de la raison pure, Kant attribue à l’imagination un rôle crucial mais problématique. L’imagination transcendantale est ce qui permet de faire le lien entre la sensibilité (qui reçoit les intuitions) et l’entendement (qui produit les concepts). Elle est donc une faculté médiatrice essentielle.

Dans la première édition de la Critique, Kant semble accorder à l’imagination un statut quasi-autonome, la présentant comme une « fonction aveugle mais indispensable de l’âme ». Dans la seconde édition, il révise sa position et subordonne plus clairement l’imagination à l’entendement, limitant son autonomie.

Cette hésitation kantienne est significative pour notre propos. L’injonction « Imagine something and just type it! » présuppose une subordination de l’imagination à la volonté (« imagine something »), puis une transparence entre l’imagination et l’expression linguistique (« just type it »). Cette double articulation fait écho aux tensions présentes dans la philosophie kantienne concernant le statut et l’autonomie de l’imagination.

La transformation contemporaine de l’imagination

La phrase « Imagine something and just type it! » va à une vitesse vertigineuse et résume, à sa façon particulière, l’histoire occidentale d’un sujet se donnant à lui-même l’injonction d’avoir des représentations mentales, de les écrire de façon transparente pour qu’ensuite la technique, cette extériorisation somatique, s’occupe du reste – c’est-à-dire, dans ce cas, produise une image supposée identique à ce qui se trouve dans l’esprit du sujet.

Cette accélération transforme profondément notre rapport à l’imagination et à la création. L’imagination artificielle ne se contente pas d’imiter ou de reproduire l’imagination humaine; elle institue un nouveau régime de l’imagination caractérisé par plusieurs aspects distinctifs :

1. Externalisation et matérialisation

L’imagination artificielle permet une externalisation quasi instantanée des représentations mentales. Entre le moment où l’on imagine « quelque chose » et le moment où ce « quelque chose » apparaît sous forme d’image, le délai est réduit à quelques secondes. Cette compression temporelle transforme notre rapport à la création et à la matérialisation des idées.

Dans les processus créatifs traditionnels, un long apprentissage technique était nécessaire pour extérioriser fidèlement une image mentale. Un peintre devait passer des années à maîtriser son art avant de pouvoir traduire adéquatement ses visions intérieures sur la toile. Cette distance entre conception et réalisation était constitutive du processus créatif lui-même, permettant des ajustements, des découvertes, des accidents heureux.

L’imagination artificielle court-circuite ce processus. Elle promet une correspondance immédiate entre l’intention et la réalisation, entre l’image mentale et l’image matérielle. Cette promesse de transparence et d’immédiateté transforme notre rapport à la création.

2. La médiation textuelle

Un aspect crucial de l’imagination artificielle telle qu’elle se déploie actuellement est la médiation obligatoire par le texte. Entre l’image mentale et l’image générée se trouve le prompt, cette description textuelle de ce que l’on souhaite voir apparaître.

Cette médiation textuelle n’est pas neutre. Elle implique une traduction, un passage d’un médium à un autre, avec tout ce que cela comporte de transformations, de pertes, d’ajouts. Décrire une image mentale par des mots suppose déjà une interprétation, une sélection des aspects jugés pertinents, une mise en ordre linéaire de ce qui se donne simultanément dans l’imagination.

L’illusion de transparence que suggère l’injonction « just type it » occulte cette complexité. Elle laisse entendre que le passage de l’image mentale au texte, puis du texte à l’image générée, pourrait se faire sans reste, sans altération significative.

3. La reconfiguration de la subjectivité

L’imagination artificielle reconfigure profondément la position du sujet créateur. Dans le paradigme traditionnel de la création, le sujet était à la fois la source de l’imagination (celui qui conçoit) et l’agent de la réalisation (celui qui exécute). Sa subjectivité s’exprimait autant dans la conception que dans la réalisation, à travers les choix techniques, les gestes, le style.

Avec l’imagination artificielle, le sujet est repositionné. Il devient celui qui imagine et qui décrit (à travers le prompt), mais il délègue la réalisation à la machine. Sa subjectivité s’exprime désormais principalement dans la formulation du prompt, dans cette capacité à traduire en mots ce qu’il imagine, à orienter l’algorithme vers le résultat souhaité.

Ce déplacement de la subjectivité créatrice transforme profondément le rapport à la création. Le sujet n’est plus dans une position de maîtrise technique, mais dans une position d’orientation, de suggestion, de dialogue avec la machine. Il ne s’agit plus tant de réaliser que de décrire, d’orienter, d’évaluer et de sélectionner parmi les propositions générées.

Les limites de la transparence

L’injonction « Imagine something and just type it! » repose sur plusieurs présupposés problématiques qu’il convient d’examiner :

1. L’accessibilité des représentations mentales

Le premier présupposé est que nous aurions un accès direct et transparent à nos propres représentations mentales. Or, comme l’ont montré de nombreux travaux en philosophie de l’esprit et en psychologie cognitive, notre accès à nos propres états mentaux est souvent partiel, médiatisé, rétrospectif.

Nos images mentales sont souvent floues, instables, fragmentaires. Elles se transforment au moment même où nous tentons de les saisir, de les fixer, de les décrire. Comme l’a montré William James dans ses Principes de psychologie, la conscience est un flux continu (stream of consciousness) plutôt qu’une succession d’états discrets et clairement délimités.

L’idée qu’on pourrait simplement « type it », c’est-à-dire transcrire fidèlement une image mentale en mots, présuppose une stabilité et une clarté des représentations mentales qui ne correspond pas à l’expérience phénoménologique réelle.

2. Les limites du langage

Le deuxième présupposé concerne la capacité du langage à décrire fidèlement des images mentales. Or, comme l’ont souligné de nombreux philosophes du langage, il existe une incommensurabilité fondamentale entre les différents systèmes symboliques.

Le passage de l’image au texte implique nécessairement une traduction, avec tout ce que cela comporte de pertes, de transformations, d’approximations. Certains aspects de l’expérience visuelle résistent intrinsèquement à la mise en mots : les nuances chromatiques précises, les relations spatiales complexes, les impressions atmosphériques subtiles.

De plus, le langage est linéaire et séquentiel, tandis que l’image est simultanée et synoptique. Cette différence structurelle fondamentale fait que toute description textuelle d’une image implique nécessairement des choix concernant l’ordre de présentation des éléments, leur hiérarchisation, leur mise en relation.

3. L’opacité des systèmes d’intelligence artificielle

Le troisième présupposé concerne la capacité des systèmes d’IA à traduire fidèlement un prompt textuel en image. Or, les systèmes comme Stable Diffusion ne fonctionnent pas comme de simples traducteurs fidèles d’instructions textuelles.

Ces systèmes sont entraînés sur d’immenses corpus d’images associées à des descriptions textuelles. Ils apprennent des corrélations statistiques complexes entre certains mots ou expressions et certaines caractéristiques visuelles. Leur fonctionnement implique de nombreuses couches d’abstraction, de transformation, d’interprétation.

L’image générée n’est pas la simple visualisation du prompt, mais le résultat d’un processus complexe d’interprétation et de génération qui possède sa propre logique, ses propres biais, ses propres tendances stylistiques. L’IA n’est pas un médium transparent, mais un interprète actif, un co-créateur dont les décisions algorithmiques façonnent profondément le résultat final.

La capture des conditions de possibilité

Il y a dans cette phrase, « Imagine something and just type it! », une description symptomatique de l’évolution actuelle de la capture qui s’applique maintenant aux conditions de possibilité des facultés humaines, et en particulier à l’intelligence (en langage kantien, la relation entre entendement et raison) et à l’imagination (dont le rôle dans le jeu des facultés kantiennes est trouble et problématique au plus haut point).

Cette capture des conditions de possibilité représente un changement radical par rapport aux formes antérieures d’automatisation et d’externalisation. Il ne s’agit plus simplement d’automatiser une tâche spécifique, mais de prendre en charge les facultés mêmes qui rendent possibles nos activités cognitives et créatives.

1. De l’automatisation des tâches à l’externalisation des facultés

Les premières formes d’automatisation concernaient des tâches physiques spécifiques : tisser, calculer, transporter. Avec l’informatique, l’automatisation s’est étendue à des tâches cognitives plus complexes : calculer, classer, rechercher, analyser.

L’imagination artificielle franchit un pas supplémentaire. Elle ne se contente pas d’automatiser une tâche créative spécifique, elle propose d’externaliser la faculté même qui rend possible toute création : l’imagination. Plus précisément, elle propose d’externaliser non pas l’acte d’imaginer lui-même (qui reste, dans le modèle actuel, l’apanage du sujet humain), mais le passage de l’imagination à la réalisation matérielle.

2. La reconfiguration du schématisme transcendantal

Dans la philosophie kantienne, le schématisme transcendantal désigne cette opération mystérieuse par laquelle l’imagination permet d’appliquer les catégories de l’entendement aux intuitions sensibles. C’est ce qui rend possible la connaissance en faisant le pont entre le concept et l’intuition.

L’imagination artificielle peut être vue comme une externalisation et une mécanisation de ce schématisme. Elle prend en charge ce passage du concept (exprimé dans le prompt) à l’intuition sensible (l’image générée). Ce faisant, elle transforme profondément notre rapport aux conditions de possibilité de la connaissance et de la création.

3. Vers une nouvelle économie de l’imagination

Cette capture des conditions de possibilité de l’imagination instaure une nouvelle économie cognitive et créative. Dans cette économie, l’accent se déplace de la réalisation technique vers la formulation du prompt, de la maîtrise du médium vers la capacité à dialoguer avec l’algorithme.

Cette nouvelle économie valorise certaines compétences (la capacité à formuler des prompts efficaces, à évaluer et sélectionner parmi les propositions générées) au détriment d’autres (la maîtrise technique du dessin, de la peinture, de la composition). Elle redistribue les rôles entre l’humain et la machine dans le processus créatif.

Finir

La formule « Imagine something and just type it! » révèle, dans sa simplicité apparente, les transformations profondes que l’imagination artificielle introduit dans notre rapport à la création, à la représentation et à la matérialisation des idées. Elle témoigne d’une accélération vertigineuse du passage entre l’image mentale et l’image matérielle, passage traditionnellement médiatisé par de longs apprentissages techniques et des processus créatifs étendus dans le temps.

Cette accélération n’est pas sans conséquences. Elle reconfigure la position du sujet créateur, transforme la nature de l’acte créatif, redistribue les compétences valorisées. Elle s’inscrit dans une longue histoire philosophique des rapports entre idée et matière, entre conception et réalisation, entre imagination et création.

L’imagination artificielle ne constitue pas simplement une automatisation ou une extériorisation d’une faculté humaine existante. Elle instaure un nouveau mode de réflexivité de l’imagination, une nouvelle manière pour l’imagination de se rapporter à elle-même, de se voir, de se penser. En ce sens, elle ne prolonge pas simplement l’imagination humaine, elle la transforme en profondeur.

Cette transformation ouvre des possibilités inédites tout en soulevant des questions fondamentales sur la nature de l’imagination, de la création et de la subjectivité à l’ère numérique. Elle nous invite à repenser ce que signifie imaginer, créer, matérialiser à une époque où ces actes sont de plus en plus médiatisés par des algorithmes dont le fonctionnement, pour une large part, nous échappe.