Et si à l’avenir, nos données informatiques n’étaient plus stockées dans des serveurs informatiques géants, mais dans des séquences d’ADN ? L’idée peut sembler surprenante, voire carrément tirée d’une œuvre de science-fiction. Pourtant, la DARPA, agence du département de la Défense américaine chargée de la recherche dans les nouvelles technologies, étudie très sérieusement cette piste. Elle possède même un programme dédié au stockage de données informatiques dans des molécules (qui incluent l’ADN, mais pas seulement), le Molecular Informatics Program (Programme d’informatique moléculaire).

Lancé l’année dernière, celui-ci a déjà investi plusieurs millions de dollars dans des projets de recherche menés par diverses facultés américaines, dont Brown, Harvard, ainsi que les universités de l’Illinois et de Washington. En 2016, cette dernière est parvenue, en collaboration avec Microsoft, à stocker un morceau de musique entier sur de l’ADN, battant ainsi le record de la plus grosse quantité de données jamais hébergée sur ce support. Pour révolutionner la manière dont nous conservons l’information, les chercheurs de Microsoft et de l’université de Washington peuvent également compter sur l’aide d’une jeune pousse installée à San Francisco, et spécialisée dans la création d’ADN de synthèse, Twist Bioscience.

Les locaux de la start-up sont installés dans le Dogpatch, vieux quartier industriel situé à l’est de San Francisco. De l’autre côté de la Baie, par-delà la grande étendue céruléenne aux reflets d’argent, les bâtiments de la ville d’Oakland ressemblent à des maisons de poupées aux contours indécis, tremblotants sous les rayons du Soleil. Les usines et entrepôts qui façonnent le paysage du Dogpatch, provisoirement laissés à l’abandon durant la seconde moitié du XX siècle, connaissent aujourd’hui une nouvelle jeunesse grâce à l’essor des nouvelles technologies. Les anciennes usines désaffectées accueillent une foule de start-up, les entrepôts sont retapés en bars branchés, cafés haut de gamme et restaurants de sushis, les dockers ont cédé la place aux hipsters à chemises à carreaux.

Ultime signe du vent de dynamisme qui souffle sur le quartier : les chantiers de construction, omniprésents. Pour se rendre jusqu’au bâtiment où loge Twist Bioscience, on slalome ainsi entre les hommes casqués, les bétonneuses et les camions, au milieu du vacarme des marteaux piqueur. Fort contraste avec les larges bureaux que Twist Bioscience partage avec différentes start-up, où règne, en cette heure matinale, un calme olympien, seulement rythmé par le bruit des touches enfoncées sur les claviers. Par la grande baie vitrée, on dispose d’une vue surplombante sur la baie. Les derniers nuages de brume matinale s’évaporent à la surface de l’eau.

L’art de la synthèse

Coïncidence amusante : Twist Bioscience a récemment été plébiscité pour avoir stocké le morceau « Smoke on the Water » de Deep Purple (ainsi que « Tutu » de Miles Davis) sur de l’ADN, en collaboration avec ses partenaires de Microsoft et de l’université de Washington. Car la start-up met son ADN créé en laboratoire au service d’une foule de projets révolutionnaires. Avant de les passer en revue, effectuons un rapide bond dans les années 1960. Au début du film Le Lauréat, M. McGuire, homme d’affaires prospère, prend à part Benjamin, jeune diplômé ingénu joué par Dustin Hoffman. Sans tergiverser, il lui conseille de faire carrière dans « le plastique », industrie selon lui promise à un grand avenir.

Non seulement la scène est devenue culte, mais le flaire de Mr McGuire ne l’avait pas trompé : le plastique est aujourd’hui omniprésent dans nos vies. Or, il est essentiellement fabriqué à partir de pétrole, une énergie fossile, donc épuisable, et de surcroît nuisible pour l’environnement. Mais selon Emily Leproust, CEO de Twist Bioscience les choses pourraient bientôt changer. « Si vous avez accès à de l’ADN de synthèse, vous pouvez manipuler le génome de la levure, de façon à ce que, lorsque cette dernière fermente le sucre, vous obteniez de l’acide adipique en lieu et place de l’alcool. Et à partir de cet acide adipique, vous pouvez ensuite fabriquer du nylon ! »

Il devient donc possible d’obtenir du plastique par fermentation, comme on fabrique de la bière. Bienvenue à l’ère de l’ingénierie bio. On peut ainsi fabriquer des tapis, mais aussi des pneus ou encore des bouteilles en plastique, sans avoir recours au pétrole. Cerise sur le gâteau : cette méthode de production est non seulement plus écologique, mais aussi moins coûteuse que les techniques traditionnelles. L’ADN de synthèse permet également de générer de nouveaux matériaux, existants dans la nature, mais jusqu’ici inutilisables par l’homme. C’est notamment le cas de la soie d’araignée.

Ce matériau possède des propriétés étonnantes : à la fois très léger et plus résistant que l’acier, il pourrait, à l’échelle humaine, stopper un train lancé à pleine vitesse. Mais il est impossible d’élever des araignées pour récolter leur soie : les bestioles s’entretuent systématiquement. Grâce à l’ADN de synthèse, il est possible, selon Emily Leproust, d’isoler le gène qui permet aux araignées de fabriquer de la soie et, en recourant au même procédé de fermentation, de fabriquer de la soie d’araignée artificielle.

Les variations sur ce thème sont infinies. L’un des clients de Twist Bioscience, Gingko Bioworks, est parvenu à isoler le gène qui génère le parfum des roses. En ajoutant levures et sucres au mélange, on obtient ainsi de l’extrait de rose plus vrai que nature que l’on peut incorporer dans des fragrances haut de gamme. Un autre client, Evolva, recourt à un procédé similaire pour fabriquer de l’extrait de vanille.

Mais l’usage de l’ADN de synthèse ne s’arrête pas là. Les applications sont également prometteuses dans la santé, notamment pour la découverte de nouveaux médicaments. « Les laboratoires testent des millions d’anticorps différents, pour trouver celui qui permet de résister le mieux à la maladie. Or, pour chaque anticorps testé, il faut un échantillon d’ADN. En diminuant le coût de ces échantillons, on permet ainsi d’accélérer la recherche. » Twist Bioscience travaille actuellement avec neuf grands laboratoires pharmaceutiques.

Troisième usage possible de l’ADN de synthèse : lutter contre la faim dans le monde, en générant des récoltes qui ne soient plus dépendantes de l’usage d’engrais. Ces derniers reposent sur un principe simple : il s’agit notamment d’alimenter la plante en azote, pour accélérer sa croissance. On recourt pour cela à divers procédés chimiques, qui impliquent souvent de brûler du pétrole. Pour éviter cette étape nuisible à l’environnement, un client de Twist Bioscience emploie l’ADN de synthèse pour modifier l’une des bactéries situées dans le sol, de façon à ce que cette bactérie capture automatiquement l’azote dans l’air, pour le transmettre ensuite à la plante. On obtient ainsi des récoltes qui n’ont besoin ni d’engrais, ni d’OGM, puisqu’elles tirent directement leur azote du sol.

À la clé, une agriculture plus saine et susceptible de nourrir davantage de personnes. Ok, tout cela est fascinant, mais comment ça marche, au juste ?

Grammaire de l’ADN

Jusqu’à une époque récente, tout cela relevait encore du registre de la science-fiction. Il faut dire que les progrès réalisés en matière d’ingénierie génétique ont été littéralement fulgurants au cours des dernières décennies. Tout commence en 1953, lorsque James Watson et Francis Crick, deux jeunes chercheurs en biologie, identifient pour la première fois la structure en double hélice de l’ADN. Cette découverte permet de comprendre comment l’information génétique se copie et se transmet. En d’autres termes, le code génétique peut désormais être décrypté.

Dans les années 1970, sont mises au point les premières méthodes permettant de séquencer l’ADN, c’est-à-dire de décoder l’information nécessaire aux êtres vivants pour survivre et se reproduire. En 1977, on parvient ainsi à séquencer le tout premier génome, celui du virus Phi X174. Il faut toutefois attendre l’an 2000 pour que l’on parvienne pour la première fois à séquencer l’intégralité du génome humain. Voilà pour l’aspect « lecture » de l’ADN. Twist Bioscience, de son côté, est spécialisé dans « l’écriture », la création d’ADN de synthèse. « Pour lire l’ADN, on prend un échantillon, on l’analyse avec une machine, et on en extrait les données. L’écriture, c’est exactement l’inverse : on part des données, et, à l’aide d’une machine, on crée un échantillon d’ADN correspondant. » explique Emily Leproust.

Si Twist Bioscience n’a pas inventé ce procédé, la jeune pousse affirme en revanche avoir considérablement accru son efficacité, en s’inspirant des progrès effectués dans le séquençage d’ADN. « Dans les années 2000, séquencer la totalité du génome humain coûtait trois milliards de dollars. Aujourd’hui, le prix a chuté à environ 1000 dollars. Cette baisse considérable a été permise par la miniaturisation : des entreprises comme 454 Life Sciences ou Illumina sont parvenues à réduire la taille des échantillons d’ADN utilisés, afin d’obtenir une technique plus efficace à un coût réduit. Nous avons fait la même chose côté écriture », relate Emily Leproust.

Lancée en 2013, la start-up a eu recours à des techniques d’ingénierie de pointe pour concrétiser son projet. Là où l’on utilise traditionnellement des tablettes en plastique pour stocker les échantillons d’ADN, l’entreprise utilise du silicium. L’usage de ce minéral résistant à la chaleur, également employé dans la confection des ordinateurs (et qui, accessoirement, donne son nom à la Silicon Valley) permet de miniaturiser les échantillons. Ainsi, là où une plaquette traditionnelle contient 96 échantillons d’ADN, la version silicium confectionnée par Twist Bioscience contient un million d’échantillons sur la même surface, ce qui permet de réduire considérablement les coûts. L’aspect innovant de la start-up se situe donc du côté de l’ingénierie plutôt que de la biologie pure et dure. Il s’agit, à proprement parler, d’une innovation produit. Mais les applications de cette innovation dans le domaine de la biologie sont, elles, stupéfiantes.

Car si Twist Bioscience a été fondée par des ingénieurs, ses clients sont bel et bien des laboratoires de recherche en biologie, pour qui la jeune pousse fabrique des échantillons d’ADN sur commande, au service de leurs expérimentations. « Lorsque vous faites de la recherche, vous devez en permanence effectuer des expériences. Plus vous avez d’échantillons d’ADN à votre disposition, plus vous pouvez tester d’hypothèses différentes . En réduisant les coûts, nous leur permettons ainsi de tester davantage d’idées et de concrétiser davantage de projets. » explique Emily Leproust.

Le monde dans une séquence d’ADN

Ces fulgurants progrès dans la maîtrise de l’ADN suscitent aujourd’hui de nombreux espoirs autour de l’usage de cette molécule pour stocker les données numériques (ce qui nous ramène à Deep Purple). Car de tous les projets évoqués, celui-ci est peut-être à la fois le plus important et le plus complexe. Avec le développement de l’internet et des objets connectés, nous produisons aujourd’hui une quantité de données sans précédent. Ainsi, plus de données ont été générées durant la seule année 2017 qu’au cours des 5 000 années précédentes de l’histoire de l’humanité. Elles sont aujourd’hui stockées sur de gigantesques serveurs.

Mais cette méthode a plusieurs défauts. Elle est d’abord extrêmement coûteuse, non seulement en termes de place, mais aussi d’émissions carbone : l’internet est ainsi aujourd’hui responsable de 3% des émissions mondiales. En outre, elle n’est pas durable. Les données stockées sur une cassette électromagnétique doivent être réenregistrées en moyenne tous les sept ans. Enfin, la miniaturisation de l’informatique (exprimée par la fameuse loi de Moore) qui, au cours des soixante dernières années, nous a permis de réduire continuellement la taille du matériel nécessaire pour stocker l’information, ne pourra se poursuivre éternellement. Il adviendra forcément un moment où notre ingénierie se heurtera aux lois de la physique.

C’est ici que l’ADN entre en jeux. Explications d’Emily Leproust. « Un fichier informatique est composé de 0 et de 1. Mais ce code en base deux peut être facilement converti en un code en base quatre, comprenant donc les chiffres 0, 1, 2 et 3. Et à partir de ce code en base quatre, on peut ensuite convertir le fichier en utilisant les quatre lettres de l’ADN, A, C, G, T. On peut ainsi prendre n’importe quel fichier numérique et le convertir sous forme d’ADN ! ». Cette dernière possède plusieurs avantages. Elle est d’abord durable : l’ADN du mammouth et de l’homme de Néandertal ont ainsi traversé des milliers d’années pour parvenir jusqu’à nous totalement intactes.

En outre, l’ADN est très économe en matière d’espace : stocker un pentabyte de données, soit l’équivalent de mille disques durs, prendrait, sous forme d’ADN, la taille d’un grain de sable. On pourrait ainsi stocker l’intégralité des données disponibles dans le monde dans l’équivalent d’un semi-remorque. Les serveurs requièrent d’importantes quantités d’énergie pour refroidir les circuits et éviter la surchauffe. La taille de l’ADN étant négligeable, l’énergie mobilisée pour le refroidissement serait également bien plus faible : l’équivalent de la consommation d’une ampoule pour tout un centre de données. Enfin, la copie prend beaucoup moins de temps qu’en version numérique.

Le principal inconvénient réside pour l’heure dans le coût de cette méthode de stockage, qui demeure prohibitif. C’est pourquoi Twist Bioscience travaille aujourd’hui avec Microsoft, l’Université de Washington et l’École Polytechnique Fédérale de Lausanne autour d’un projet de recherche visant à diminuer ce coût. C’est dans le cadre de ce projet que les morceaux de Deep Purple et de Miles Davis ont été stockés dans de l’ADN. En 2012, des chercheurs de l’Université d’Harvard avaient déjà fait de même avec le contenu d’un livre. Plus récemment, des chercheurs de cette université ont remis le couvert en sauvegardant les diapositives d’Eadweard Muybridge, qui, mises bout à bout, montrent un cavalier au pas de course et constituent l’ancêtre de la vidéo, sur une séquence d’ADN. C’est aussi pourquoi, depuis l’an passé, le DARPA mobilise d’importantes ressources financières pour développer le stockage ADN.

Un autre danger pèse toutefois sur cette méthode de stockage révolutionnaire. Si l’ADN n’est pas un support digital, elle n’est pas pour autant à l’abri des hackers. Ainsi, l’an passé, des chercheurs de l’Université de Washington ont démontré qu’il est possible de coder un logiciel malveillant dans une séquence d’ADN. Lorsque cette dernière est lue et téléchargée sous forme de données par un ordinateur, le logiciel n’a plus qu’à infecter celui-ci. Les chercheurs affirment toutefois que ce type de menace demeure pour l’heure cantonnée à un lointain horizon. À condition que l’on parvienne à compresser les coûts et à se prémunir des biohackers, le stockage des données sur l’ADN pourrait donc bel et bien s’imposer comme le moyen le plus efficace de sauvegarder nos informations numériques. Bref, si Le lauréat était transposé en 2018, nul doute que le rusé Mr McGuire conseillerait au jeune Benjamin de faire carrière dans l’ADN.


Couverture : Twist Bioscience