Ces images ont l’air de photos prises hier, et pourtant ces bâtiments n’existent plus depuis plus d’un siècle. Comment se fait-il ? Nous sommes parvenus, grâce aux derniers outils d’intelligence artificielle (et beaucoup de patience) à leur faire réaliser l’impensable : faire revivre la ferme monastique de Billancourt comme, si elle était encore là.
Petit flashback
Durant la seconde moitié de l’année 2020 nous réalisions, pour la première fois, une reconstitution de la ferme de Billancourt. Elle était située près de la place Jules Guesde actuelle. Nous avions pour base trois descriptions et un plan de masse de 1770 disponibles aux archives municipales et nationales. Ce travail avait été réalisé en collaboration avec une conservatrice du patrimoine, spécialiste des fermes médiévales. L’aventure de cette reconstitution est accessible via le menu « La ferme de Billancourt ».


Cette modélisation avait essentiellement pour objectif de restituer les volumes, situer les bâtiments, les chemins, les cultures, selon nos informations. Mais elle manquait singulièrement de texture et de nuances. Pour aller plus loin, nous avons cherché à lui donner cette puissance d’évocation qui lui manque, un aspect le plus proche possible de ce que le propriétaire de l’époque, Nicolas Claessen, un ancien capitaine de vaisseau de la Compagnie des Indes, a pu connaître. Le domaine était alors à son apogée.
Nous avions contacté plusieurs illustrateurs spécialisés dans la reconstitution de bâtiments historiques, mais les devis renvoyés étaient décourageants et hors de portée de notre blog.
Aujourd’hui les IA génératives font des avancées remarquables. Et si nous donnions à ces outils les vues 3D que nous avions réalisées en 2020 ? Seraient-ils capables de leur donner vie ?
Les nombreux essais
Les premiers essais sont entrepris avec cinq outils d’IA génératives capables de synthétiser des images à partir d’autres images. Les résultats sont tout d’abord décevants : l’IA invente ou supprime des détails, des bâtiments ou des fenêtres, la lumière est jaunâtre, les ombres sont artificielles. Certaines IA inventent carrément tout autre chose et ça ressemble à ce qu’on ne veut plus voir sur les réseaux sociaux. La première étape consiste alors à éliminer les outils les moins sérieux. Nous ne retenons que deux IA pour la suite des tests.
Il faut opter pour un rendu : nous testons des visuels à la façon des gravures ou des tableaux du XVIIIe ou du XIXe siècle. Le résultat est très décevant. Étonnamment, c’est le rendu photoréaliste qui nous parait le plus prometteur.


Nous nous rendons compte que, pour que l’IA comprenne exactement ce que nous voulons, il faut formaliser soigneusement, complètement et en bon français, ce qu’on attend. C’est tout l’art du « prompting ». Tout d’abord, nous demandons un rendu photograhique réaliste, « comme si la vue avait été prise par un appareil photo moderne« .
Pour continuer, nous lui demandons de « respecter scrupuleusement les dimensions et l’emplacement de chaque bâtiment, des portes, les fenêtres, les cultures« , etc…. Nous Précisons la nature des toitures : ardoise pour le pavillon, et tuiles pour le reste.


Nous précisons des conditions météorologiques, sinon l’IA nous plaque une atmosphère bien peu compatible avec les lumières de l’ïle de France. Pour éviter un rendu trop artificiel ou trop neuf, il faut lui dire que « la grange est ancienne, en moellons de vielle pierre« , ainsi que le logis, que « le sol est sillonné par le passage du bétail et des charrettes ». Nous avons même demandé des « traces d’humidité au bas des murs« . Nous précisons que la pavillon, en revanche est récent (à l’aube de la révolution française il avait à peine un siècle).

Nos tentatives d’agrémenter la scène de personnages du XVIIIe siècle, de bétail ou de charrettes sont vite abandonnées, car le résultat n’est pas du tout à la hauteur. L’envol des oiseaux est conservé.
De tâtonnements en tentatives, les résultats s’améliorent de semaine en semaine. Finalement, l’outil le plus doué pour cet exercice s’avère être Sora, une IA d’Open AI bien connue, mais ChatGPT ne s’en sort pas mal.
Bref, après de nombreuses semaines de test et des dizaines de lignes de prompt, nous sélectionnons cinq angles de vue 3D et les soumettons à la machine. Le résultat final est assez bluffant !

Il nous a fallu tout de même effectuer quelques retouches finales, comme rehausser une ligne d’horizon trop basse ou gommer des détails incongrus.
L’IA réussit le miracle de nous plonger dans la vraie ferme de Billancourt. Avons-nous sous les yeux l’aspect exact de la ferme en 1770 ? Non, bien sûr, mais ces rendus contiennent tout ce que nous savons d’elle et des fermes similaires de l’époque en Ile-de-France. Le reste est du domaine de l’interprétation. Ce qui nous touche, lorsque nous les regardons, c’est leur puissance d’évocation, leur capacité à nous transporter dans le temps, à nous rapprocher de notre patrimoine disparu.
Bien sûr, en regardant de près, des aberrations resteront visibles, mais la vue d’ensemble est réellement convaincante. Qu’en pensez-vous ?


