Le monde dans lequel nous vivons regorge de données numériques dont l'archivage pose de nombreux problèmes. Tous les supports existants ont des durées de vie relativement faibles, n'excédant pas, au mieux, quelques dizaines d'années. Les spécialistes de la bio-informatique rêvent donc depuis la fin des années 80 de stocker des informations dans l'ADN, la molécule très stable qui code le programme génétique des êtres vivants. En théorie, quelques grammes d'ADN pourraient contenir pendant des milliers d'années les informations contenues dans plusieurs milliers de gros disques durs de plus de 500 Go.
Cette piste de recherche, loin de relever de la science-fiction, a récemment fait l'objet de travaux très prometteurs. Une équipe européenne de l'institut européen de bio-informatique (EMLB-EBI) basé à Londres et dirigée par Nick Goldman rapporte jeudi dans la revue Nature avoir réussi à produire puis à décoder de l'ADN contenant différentes données: un enregistrement mp3 du discours «I have a dream» de Martin Luther King, une photo de l'institut, une copie de l'article historique de Watson et Crick décrivant la structure moléculaire des composant de l'ADN et un texte contenant l'ensemble des sonnets de Shakespeare.
«Un minuscule grain de poussière» d'ADN obtenu
Nick Goldman pointe le «grain d'ADN» dans lequel sont stockées les données.
La première partie du travail a consisté à transformer la version numérique de ces documents, une succession de 0 et de 1, en un code ADN - une succession de lettres A, C, T ou G correspondants aux différents barreaux dont peut être composée la molécule en double hélice. Comme il n'est pas possible de synthétiser une molécule très longue, les chercheurs ont décomposé le code en milliers de séquences plus courtes se recoupant les unes les autres et intégrant une information sur leur place dans la séquence globale. Cette technique permet au passage de gommer les éventuelles erreurs dans la fabrication ou la lecture du code ADN.
L'entreprise américaine Agilent s'est alors occupée de produire la centaine de milliers de brins d'ADN commandés par les chercheurs puis les ont dupliqué à 12 millions d'exemplaires avant de les lyophiliser pour qu'ils se conservent mieux. Ils ont alors renvoyé «le minuscule grain de poussière» obtenu et contenant toutes les données. L'équipe européenne a alors mis en place des techniques traditionnelles de séquençage pour décoder l'ADN de synthèse reçu. Ils ont ainsi pu reconstituer les fichiers d'origine sans la moindre erreur visible.
10.000 euros le Mo mais un coût de conservation quasi-nul
Il ne s'agit pour l'instant que d'une preuve de concept mais elle montre que l'ensemble du procédé d'archivage par l'ADN est d'ores et déjà réalisable techniquement. Cela vient enrichir des travaux similaires publiés en août dernier dans Science et dirigés par George Church, de l'université Harvard. La méthode d'archivage était légèrement différente: elle permettait de stocker une plus grande densité de donnée mais était plus sensible aux erreurs de lecture.
Pour l'instant cette technique est encore très chère. Les chercheurs évoquent dans Le Temps un coût approximatif de 10.000 euros pour la création d'un mégaoctet d'ADN de stockage. A titre de comparaison, une clé USB de 8 Go - environ 8000 Mo - ne vaut pas plus de 15 euros aujourd'hui. «Comme le coût de conservation de l'ADN est quasi-nul, la méthode est déjà compétitive pour des applications très pointues», explique au quotidien suisse Christophe Dessimoz, co-signataire de l'article paru dans Nature. «Par exemple, pour conserver à très long terme les coordonnées de sites nucléaires. D'ici 10 ans, le prix sera divisé au moins par 100 ce qui permettra vraiment de développer l'archivage par ADN.»
Aucun commentaire:
Enregistrer un commentaire