Industrie et Technologies : Veille des technologies émergentes et des solutions innovantes. Ingénieur de l'année, CNISF et derniers brevets

Venise pérennise ses archives

| |

Par publié le à 14h20

venise-perennise-ses-archives

Détail du manuscrit de Galilé décrivant sa lunette astronomique

Les Archives d’Etat de Venise qui couvrent une période de plus de 1 000 ans vont être numérisées et indexées pour permettre aux historiens du monde entier de travailler sur ces documents très fragiles. Ainsi est né le projet Venice Time Machine pour que les archives de la Sérénissime se retrouvent accessibles dans le cloud.

La République de Venise, la Sérénissime, fut l’un des poumons économiques et culturels du monde occidental du Moyen-Age au XVIe siècle, avant de disparaître avec le Traité de Campo-Formio en 1797.

Ce millénaire de stabilité politique nous a laissé des archives inestimables qui contiennent une énorme quantité de documents manuscrits dans de multiples langues, ainsi que des dessins. On estime qu’elles représentent environ 80 km de rayonnages, où reposent des documents administratifs, allant de certificats de décès et de déclarations d’impôts à des cartes géographiques et des plans d’urbanisme.

La quantité, la diversité et la précision des documents de l’administration vénitienne sont uniques dans l’histoire du monde occidental. Recouper cette masse d’informations permet de reconstituer des pans entiers du passé de la cité, tels que des biographies complètes, les dynamiques politiques, voire même l’apparence de certains bâtiments ou de quartiers. « Ces documents sont intriqués de manière complexe, de sorte qu’une fois que l’on croise leurs références, on peut leur faire raconter une histoire beaucoup plus riche », explique Raffaele Santoro, directeur des Archives d’Etat de Venise.

Numériser et analyser des millions de documents

Mais ces pièces sont le plus souvent très délicates à manipuler et parfois dans un état de conservation préoccupant. Il est donc difficile d’en autoriser l’accès aux historiens. D’où l’idée de numériser cet énorme volume de documents et d’en faciliter l’accès numérique. Ainsi est né le projet Venice Time Machine. Il réunit des chercheurs de l’EPFL et de l’Université Ca’Foscari de Venise, chargés de développer l’infrastructure et les technologies nécessaires pour convertir en un gigantesque système d’information l’énorme quantité de manuscrits administratifs des Archives d’Etat vénitiennes. Cette opération va non seulement préserver ce patrimoine inestimable, mais également fournir un exceptionnel outil de navigation virtuelle à travers l’histoire vénitienne.

Lancé il y a un an, ce projet a impliqué, à ce jour, plus d’une centaine de chercheurs et d’étudiants. Ceux-ci ont développé l’infrastructure générale, trié et regroupé les archives en fonction de leur format et défini une chaîne de travail adaptée à la digitalisation de masse. Un comité international, composé d’experts renommés issus des universités de Stanford, Columbia, Princeton et Oxford, supervise les efforts menés pour faire du projet un outil fondamental dédié à l’étude de l’histoire de Venise.

Ces archives vont ainsi trouver via le Web une nouvelle existence virtuelle. Le passé de la cité sera réactualisé, que ce soit par la reconstitution d’arbres généalogiques et des organisations sociales d’autrefois, ou par la possibilité de visualiser son développement urbain. La numérisation de tous ces trésors ouvrira également de nouveaux champs de recherches. « Ce projet nous permet d’étudier des sujets jusque-là pratiquement inaccessibles », estime ainsi Dorit Raines, historienne de l’Université Ca’Foscari, qui a entrepris de parcourir et recouper quelque 300 000 testaments, afin de retracer l’histoire de la propriété des biens précieux à travers les siècles.

Des défis technologiques

Une opération qui pose de nombreux défis technologiques. Il s’agit d’établir une chaîne de travail optimale pour une reconnaissance au plus juste des millions de documents. Pratiquement, la numérisation de masse implique non seulement de scanner systématiquement tous les anciens manuscrits, mais aussi de trouver le moyen de traiter automatiquement différents styles d’écriture et d’analyser plusieurs langues, dont le latin, qui ont sensiblement évolué au fil du temps.
 



   Reconnaissance de mot dans un manuscrit en latin
 

Etant donné l’énorme quantité d’informations à traiter, des techniques de gestion, d’extraction et de classification de données massives sont donc essentielles. Les algorithmes de reconnaissance automatique de textes spécifiques sont par exemple continuellement adaptés et améliorés au fur et à mesure que la numérisation avance, et que s’enrichit la banque de données sur les Vénitiens et leurs lieux de vie.

« Le but est de transformer tous ces dossiers en une énorme base numérique du passé », explique Frédéric Kaplan, professeur à l’EPFL et responsable du projet. « La bonne nouvelle, c’est que la masse de données ne représente pas un problème, mais au contraire une partie de la solution, puisque nous sommes ainsi de plain-pied dans les technologies en pleine évolution du Big Data ».

Un projet qui devrait avancer plus rapidement car il vient de recevoir le soutien financier de la Fondation Lombard Odier qui initie, finance et développe des initiatives stratégiques ambitieuses de l’EPFL. Elle a sélectionné le projet Venice Time Machine pour sa combinaison exemplaire entre art, histoire et science, et soutiendra les chercheurs dans leurs efforts pour le développement des outils de numérisation et d’exploitation de données.

Et ça, c’est nouveau !

Jean-François Prevéraud

Pour en savoir plus : http://vtm.epfl.ch & http://www.unive.it & http://www.fondationlombardodier.org,

Partagez l’info :

Envoyer à un ami
Abonnez-vous et accédez à l’intégralité de la veille technologique

Commentaires

Réagissez à cet article

* Informations obligatoires

erreur

erreur

erreur

Veille technologique

pour les professionnels de l’industrie
S’abonner

S’inscrire à l’hebdo de la techno :

Rechercher sur Industrie & Technologies