Le sacrifice
Une ville, des gens marchent, s’affairent, discutent à la terrasse des cafés, se rencontrent et se séparent. Les automobolistes s’impatientent, les magasins sont ouverts, des gens sont assis sur des bancs, d’autres promènent leurs chiens. Toute une vie.
Des sous-titres s’affichent à intervalle régulier décrivant ce que l’on peut voir. Un réseau récursif de neurones artificiels génère ces textes automatiquement.
On entend une voix-off synthétique reprend ces éléments descriptifs et commence à raconter une histoire : ce corps dans un café est démembré, ces gens qui parlent ensemble sont morts, les voitures sont rongées par la rouille depuis longtemps, il ne reste plus que de lointains vestiges des bâtiments et les rues sont de vagues souvenirs dans la densité des forêts.
On ne sait pas si la machine hallucine, anticipe le futur ou souhaite le provoquer.
– Un logiciel de reconnaissance visuel est appliqué à des vidéos sur lesquelles on a superposé de la fumée. Le logiciel produit des erreurs et arrive parfois à décrire l’image. Le texte est complété par un générateur de textes en réseau de neurones qui compare le segment présenté et qui en déduit la suite possible à partir d’un ensemble de textes apocalyptiques.
A city, people walk, work, chat on the terrace of cafés, meet and separate. Motorists are getting impatient, shops are open, people are sitting on benches, others are walking their dogs. A lifetime.
Subtitles are displayed at regular intervals describing what can be seen. A recursive network of artificial neurons generates these texts automatically.
We hear a synthetic voice-over taking up these descriptive elements and starting to tell a story: this body in a café is dismembered, these people talking together are dead, cars have been corroded by rust for a long time, there are only distant remains of buildings left and the streets are vague memories in the density of the forests.
We don’t nown if the machine hallucinates, anticipates the future or wishes to provoke it.
– Visual recognition software is applied to videos that have been overlaid with smoke. The software produces errors and sometimes manages to describe the image. The text is completed by a neural network text generator that compares the segment presented and derives the possible sequence from a set of apocalyptic texts.
Subtitles :
1- ILSVRC-2012-CLS image classification dataset https://openai.com/blog/better-language-models/
2- GPT-2 in order to continue the sentences
Voices :
1- TxtRNN