dimanche 2 décembre 2012

Biologie moléculaire : la mutation informatique


Tout a commencé avec James D. Watson, Francis Crick, Rosalind Elsie Franklin [1] et quelques autres dans les années 1950 : ils nous ont appris que la conformation des êtres vivants se déduisait de l’information génétique codée par l’acide désoxyribonucléique (ADN) de leurs cellules. Les macromolécules (on dit aussi polymères) d’ADN sont de longues chaînes de motifs moléculaires élémentaires, les nucléotides, dont il existe quatre variétés : l’adénine (notée A), la thymine (notée T), la cytosine (notée C) et la guanine (notée G). Le paradigme de la biologie moléculaire postule que l’information génétique est formulée par un texte, le génome, écrit dans un alphabet de quatre lettres, A, T, G, C, et que la connaissance de ce texte permet de connaître les fonctions de l’organisme considéré, sans avoir à entrer dans des considérations supplémentaires d’ordre physico-chimique.

Avec l’entrée en vigueur du paradigme de la biologie moléculaire, l’informatique était appelée inéluctablement à prendre un rôle crucial dans la recherche en biologie, puisque la recherche se fondait désormais sur l’analyse d’un texte. C’est aujourd’hui une évidence. Le séquençage du génome, c’est-à-dire l’obtention de son texte au moyen d’appareils nommés séquenceurs, est accessible depuis plusieurs années pour tous les organismes, ainsi pour les 3,4 milliards de nucléotides et les quelques 25 000 gènes du génome humain, et ces données ont bouleversé de fond en comble le métier de biologiste. La connaissance du génome, complétée par la robotisation des manipulations « en phase humide », déplace le chercheur de la paillasse, des boîtes de Pétri et du Pipetman vers l’ordinateur, lui fait retirer sa blouse blanche, et lui donne accès à des méthodes scientifiques entièrement nouvelles pour étudier la génétique, la structure des protéines, le métabolisme, etc. Des investigations qui demandaient des mois de travail répétitif et entaché d’erreurs à la paillasse sont désormais résolues en quelques heures par des méthodes informatiques. La consultation des banques de données qui archivent les résultats exhaustifs du séquençage et des calculs de structure des protéines donne en quelques minutes la réponse à des questions dont la solution directe aurait constitué un thème de recherche à part entière. Ce qui signifie que l’on peut désormais se poser des questions inenvisageables auparavant. Il y a encore, bien sûr, de la biologie « en phase humide », mais la biologie moléculaire informatique a pris une place prépondérante dans les avancées de la recherche.

Il y a vingt ans nous étions à un tournant. Les gens bien informés de la recherche mondiale savaient déjà que les choses allaient dans cette direction, les mandarins résistaient pied à pied, accrochés à leurs paillasses, les institutions de pointe avaient déjà lourdement investi en informatique, telles le National Center for Biotechnology Information (NCBI) créé en 1988 à Bethesda près de Washington, ou le Wellcome Trust Sanger Institute créé en 1992 à Hinxton près de Cambridge en Angleterre. L’Institut Pasteur était en retard, et en prenait conscience. C’est en 1991 que François Rougeon, Directeur de la recherche à l’Institut Pasteur, m’a proposé de le rejoindre pour l’aider à mettre sur pied une infrastructure bioinformatique. En fait, avant de faire de la bioinformatique, il fallait déjà créer l’informatique, recruter une équipe, installer des serveurs et un réseau, ce qui occupa une bonne part de notre temps les premières années.


[1] L’histoire a retenu les noms de Crick et Watson ; Rosalind Elsie Franklin a joué dans cette découverte un rôle aussi important, mais elle est morte avant l’attribution du prix Nobel.

1 commentaire:

  1. L'avis d'une chercheuse sur "paillasse"

    Oui et non. En fait c'est un thème récurrent depuis une dizaine d'années dans les travaux en "social studies of sciences" ou STS (Sciences, technique et société) dans le domaine de la biologie. Il existe une importante littérature qui développe ce type d'idée.

    C'est clair que l'informatique est devenue de plus en plus importante et indispensable à la biologie et que la bioinformatique est devenue une discipline à part entière. Mais l'idée que la bioinfo va remplacer la paillasse ou devenir plus importante qu'elle me paraît totalement fausse. La bioinfo devient entre autres indispensable pour gérer le très grand nombre de données générées par la paillasse. Sans données expérimentales, pas d'informatique. Un autre rôle revendiqué (et réel) de la bioinformatique, c'est de générer des prédictions qui vont orienter plus efficacement la recherche expérimentale. La biologie est et reste une discipline expérimentale.

    Tous les discours sur les révolutions récentes en biologie - on a aussi l'idée récurrente de la biologie transformée en 'big science' avec les méthodes de séquençage à haut-débit, l'utilisation massive de plate-formes technologiques robotisées qui auraient radicalement transformé les pratiques scientifiques- basées sur des études de cas (la tendance au micro dans les STS) demande à être contrôlée par des données empiriques de sociologie du travail scientifique de type macro : combien de bioinformaticiens pour combien de chercheurs à la paillasse, combien d'articles générés uniquement par l'informatique, combien de personnels dans les plate-formes et combien dans les laboratoires traditionnels, etc…?

    RépondreSupprimer