Décoder le passé : l’intelligence artificielle révèle les mots cachés dans les parchemins anciens

Dans un mélange surprenant d'antiquité et de technologie moderne, des chercheurs se sont tournés vers l'intelligence artificielle (IA) pour découvrir des secrets enfermés dans d'anciens rouleaux calcinés par la tristement célèbre éruption du mont Vésuve en 79 après JC. Un étudiant de 21 ans à l'université du Nebraska a récemment fait la une des journaux en remportant 40 000 $ pour avoir déchiffré un mot des énigmatiques papyrus d'Herculanum dans le cadre de l'ambitieux Vesuvius Challenge.

Un héritage enveloppé de cendres et de mystère

Subtilement cachés près de Pompéi, les papyrus d'Herculanum étaient conservés dans la bibliothèque d'une villa privée, supposée avoir appartenu au beau-père de Jules César, Lucius Calpurnius Piso Caesoninus. Ces rouleaux sont restés dans un état délicat entre conservation et destruction, cachés sous 20 mètres de boue volcanique pendant près de deux millénaires avant d'être découverts en 1700. Cependant, leur fragilité présente un risque important : une mauvaise manipulation peut les réduire en poussière, poussant les chercheurs à trouver un moyen d’explorer leur contenu sans les déployer physiquement.

The Vesuvius Challenge : un pari d’un million de dollars sur des mots anciens

Lancé en mars, le Vesuvius Challenge, soutenu par des investisseurs de la Silicon Valley, propose un prix attractif de 1 000 000 $ visant à accélérer le déchiffrement des rouleaux, qui résident désormais dans les collections de l'Institut de France à Paris.

Le défi d’utiliser la technologie contemporaine, notamment l’intelligence artificielle, pour révéler le langage caché des rouleaux sans perturber leur intégrité physique. Le professeur Brent Seales et son équipe ont fourni un point de départ en publiant des milliers de photos radiographiques 3D et de fragments de papyrus et en partageant un programme d'IA formé pour discerner les lettres des parchemins.

L'Odyssée de l'IA : Révéler d'anciens secrets grâce à la technologie moderne

Deux étudiants, Luke Farritor et Youssef Nader, sont devenus des figures de proue de ce défi, ciblant tous deux le mot grec ancien « oc », qui se traduit par « violet ». Cette découverte a été rendue possible grâce à leur approche innovante de l’intelligence artificielle, Farritor développant un modèle d’apprentissage automatique axé sur un « motif de crépitement » semblable à de l’encre initialement identifié par Casey Handmer. Nader, cependant, s'est appuyé sur cela, en améliorant les techniques d'apprentissage automatique et en appliquant une stratégie de transfert de domaine pour adapter les modèles spécifiquement aux parchemins.

La découverte initiale de Handmer consistant à identifier un « motif de crépitement » unique dans les tomodensitogrammes des rouleaux a conduit à un tournant dans le défi. La reconnaissance de ce motif, qui ressemblait fortement à de l'encre, a donné lieu à un processus cyclique de découverte et d'amélioration. Au fur et à mesure que davantage de crépitements étaient identifiés et intégrés au modèle d'apprentissage automatique de Farritor, le système s'est progressivement amélioré, révélant davantage de crépitements et fournissant un aperçu plus approfondi des parchemins.

Techniques adaptatives : fusionner des textes anciens avec des algorithmes modernes

L'approche de Nader a suivi une trajectoire légèrement différente mais tout aussi innovante. Il a passé en revue les meilleurs projets du concours Ink Detection sur Kaggle, dans le but d'amplifier la méthode d'apprentissage automatique de Stephen Parsons à l'aide de pièces isolées. En appliquant une stratégie de transfert de domaine, il a effectué une pré-formation non supervisée sur les données des parchemins, affinant ensuite les étiquettes des fragments en déterrant progressivement les mots cachés des anciens parchemins.

Avec seulement quelques lignes et au moins quatre colonnes de texte désormais distinguables, comme l'a noté le Dr Federica Nicolardi, papyrologue à l'Université Federico II de Naples, le chemin à parcourir est plein de potentiel. La course pour décoder le texte environnant et en révéler davantage sur le contenu insaisissable des parchemins est un voyage enrichi par la synergie entre passé et futur, où les écrits anciens sont progressivement illuminés à travers le prisme de la technologie contemporaine.

Le Vesuvius Challenge témoigne des résultats extraordinaires qui peuvent être obtenus lorsque le passé et le futur se rencontrent. Alors que les chercheurs continuent de percer les secrets enfermés dans le fragile papyrus, les mots des civilisations anciennes renaissent grâce à la puissante combinaison d’intrigues historiques et des capacités inégalées de l’intelligence artificielle. La découverte de ces textes anciens non seulement ressuscite les voix perdues du passé, mais illustre également les puissantes capacités de la technologie moderne, reliant les âges et découvrant l'histoire lettre par lettre.