Accueil du site > TECHNOBIO > La sauvegarde ADN se précise

La sauvegarde ADN se précise

jeudi 24 janvier 2013

par Agnès Vernet

Bien qu’aujourd’hui inabordable, les stratégies de stockage de données sur ADN s’affinent et les projections de coûts construisent l’archivage « nucléique ».

Des archives d’ADN ? Depuis les travaux des américains Church, Gao et Kosuri sur le stockage de données sur puce à ADN, la « bibliothèque nucléique » n’est plus un concept de science-fiction. Elle n’en reste pas moins l’objet de recherches d’anticipation, au vu des coûts d’encodage et de restitution des éléments, comme le démontre les recherches de Nick Goldman et son équipe à l’Institut européen de bio-informatique de Hinxton en Grande-Bretagne.
Cette équipe a développé une stratégie permettant d’encoder et de récupérer différents formats de données – courants aujourd’hui – avec une précision optimale (100 %). 789 kilobits ont ainsi été encodés, synthétisés sous forme d’ADN par la société californienne Agilent Technologies, puis envoyés par la poste sous forme sèche au laboratoire de Hinxton. Après les séquençages, les destinataires ont retrouvé leurs 154 sonnets de Shakespeare (en format texte), un article scientifique (en pdf), un extrait du discours de Martin Luther King « I have a dream » (en mp3) et le code Huffman utilisé par les biologistes pour convertir en code binaire les séquences de bases (en format texte).
Ces fichiers ont été encodés sur de courts brins d’ADN chevauchants, chaque brin contenant aussi une balise d’indexation afin de le situer dans l’ensemble. Cette expérience a nécessité la construction d’une collection de 153 335 brins de 117 nucléotides chacun. Le code est basé sur une traduction des données binaires en succession GATC où une séquence de huit 0 et/ou 1 est transposée en « mots » de GATC, sans jamais autoriser les successions de bases identiques. Enfin, la collection chevauchante de brins est réversible puisqu’elle peut être lue dans les deux sens. L’ensemble a été conçu deux fois. Et la somme de ces éléments constitue un système de correction d’erreur.
Néanmoins, les chercheurs ont du faire face à deux « trous » lors du décodage, des zones où, malgré la duplication de la collection, le séquençage présentait des incertitudes. Ils ont alors reconstruit ces zones à partir d’hypothèses en fonction des séquences adjacentes, de manière parfaitement exacte.
Le stockage de données par ADN semble techniquement possible, mais est-il économiquement viable ? Selon le modèle de coûts présenté par les chercheurs, les outils de synthèse et de séquençage de l’ADN permettent aujourd’hui de proposer ce support d’archivage pour une durée de 600 à 5 000 ans. Autant dire qu’il est difficile d’identifier les informations concernées par cette échelle. Mais la réduction très rapide des coûts technologiques pourrait rendre pertinente cette approche dans la décennie à venir. On serait alors en mesure de réaliser des stockages de données pour des durées d’environ 50 ans. Pour transmettre des images ou des vidéos de famille en sautant une génération ? Par exemple.

Goldman N et al. (2013) Nature doi:10.1038/nature11875

Nick Goldman et son archive « nucléique »
© European Molecular Biology Laboratory

SPIP Contact | Plan du site | Suivre la vie du site RSS 2.0 | mentions légales | logo Lavoisier logo facebook logo twitter Se connecter