mardi 17 octobre 2017

Accueil du site > Technologie > Un logiciel permet de reconstituer les documents passés au broyeur

Un logiciel permet de reconstituer les documents passés au broyeur

David Maume, 01net

mardi 29 mai 2007, sélectionné par Spyworld

logo

Après la chute du Mur, la Stasi avait mis ses archives en lambeaux. Des chercheurs ont conçu un outil pour les déchiffrer.

Six cent millions de pièces : c’est la taille d’un gigantesque puzzle de papier qu’a commencé à reconstituer, depuis mercredi 9 mai, un puissant logiciel mis au point par l’institut berlinois Fraunhofer IPK. Les fragments de papier sont en fait les restes des archives de la Stasi, la police secrète de l’ancienne Allemagne de l’Est, que des officiers ont tenté de détruire juste après la chute du mur de Berlin, le 9 novembre 1989.

En deux mois, environ 45 millions de feuilles A4 ont été découpées avec de puissants massicots mécaniques ou déchirées à la main (quand les machines chauffaient...). Les sacs contenant les documents déchiquetés devaient être brûlés mais les problèmes rencontrés par les officiers pour les transporter discrètement les ont sauvés de la destruction. Ils ont finalement été cachés jusqu’à ce que le gouvernement de l’Allemagne réunifiée les retrouve en 1990.

Reconnaissance des formes, des couleurs et de l’écriture

Depuis, une équipe d’une quinzaine de personnes a essayé de reconstituer manuellement ce gigantesque puzzle contenant de précieuses informations sur les activités de la police secrète, et notamment sur les milliers de collaborateurs qui l’ont aidée à espionner la population. Mais la tâche est complexe et seuls 350 des 16 250 sacs ont pu être traités.

Pour accélérer les recherches, le gouvernement allemand a lancé en 2003 un appel d’offres visant à automatiser le travail de reconstitution. Ce dernier a été remporté par l’institut Fraunhofer qui a mis au point un des logiciels de reconnaissance de formes les plus puissants au monde. Son partenaire, Arvato Direct Services, filiale de Bertelsmann, s’occupe lui de la numérisation des morceaux de papier.

Le traitement des sacs demande toujours du temps car, un par un, les fragments de document doivent être alignés sur un grand tapis roulant puis scannés des deux côtés. Chaque image est alors enregistrée dans une base de données et le logiciel commence son travail de reconstitution. Il tient compte de la forme, de la couleur, de l’écriture, du grain du papier, etc. Autant d’indices qui lui permettent d’assembler deux fragments voisins.

Le gouvernement allemand a pour l’instant alloué un budget de 6,3 millions d’euros afin de reconstituer 400 sacs d’ici à deux ans. Mais, selon les chercheurs de l’institut, pour reconstituer l’intégralité des archives, le logiciel devrait mettre environ cinq ans.


Envoyer : Newsletter Imprimer : Imprimer Format PDF : Enregistrer au format PDF PartagerPartager :