Métagénomique, interactomique, protéomique, lipidomique… Qu’est ce que c’est ?

f e c cc o.

Cet article est publié dans le cadre de la Fête de la Science 2017, qui se tient du 7 au 15 octobre, et dont The Conversation France est partenaire. Retrouvez tous les débats et les événements de votre région sur le site Fetedelascience.fr.

Pasteur est bien loin… Même si les microbiologistes font encore parfois des cultures en flacon ou sur boîtes de Petri, de nouvelles technologies ont émergé dans ce domaine dans les années 1990, comme dans les autres sciences biologiques.

Tout d’abord, les techniques de culture en microplaques : elles permettent de suivre en simultané la croissance des micro-organismes dans une centaine de conditions différentes et d’importer directement sur ordinateur les courbes de croissance afin de les analyser. Parallèlement, des techniques de biologie moléculaire se sont imposées pour identifier les micro-organismes par analyse de leurs acides nucléiques (ARN ou ADN), puis, pour modifier leur métabolisme en insérant des séquences d’ADN mobiles (plasmides) naturellement présentes dans la plupart des bactéries.

Le génome bactérien moyen dépasse fréquemment plusieurs millions de paires de bases (nucléotides) : pour évaluer sa complexité, les outils informatiques sont rapidement devenus indispensables. Il s’agit en particulier de suivre les mutations souvent associées à des changements de virulence ou de résistance aux antibiotiques.

Séquenceur haut débit. pxhere

Toutefois, on sait aujourd’hui qu’on ne peut cultiver tout au plus que de 0,1 à 1 % des bactéries présentes dans l’environnement, sachant que le nombre des micro-organismes présents dans l’environnement est immense. Un corps humain contient ainsi près de 1,5 kg de micro-organismes, localisés essentiellement dans l’intestin et sur la peau, soit cent mille milliards de germes. La composition de cette population microbienne peut avoir un impact direct sur notre santé.

Pour étudier de telles populations et distinguer les espèces, l’analyse de séquences (parties) caractéristiques des acides nucléiques est la technique la plus précise, mais cela implique de travailler sur une somme de données qui dépasse les capacités de l’esprit humain. Des techniques de « séquençage haut-débit » ont été développées mais une seule expérience peut générer plusieurs Teraoctets (To) de données, soit toute la mémoire d’un ordinateur domestique actuel. De plus il faut pouvoir comparer les séquences obtenues avec des banques de données, et donc les faire transiter à haute vitesse par Internet.

Des milliers de milliards de données

On parle ainsi de métagénomique pour évoquer le traitement de masses considérables de données liées au génome (ADN ou ARN). Les serveurs qui accompagnent ces appareils, comme celui qui sera prochainement implanté au sein du Laboratoire de Microbiologie Signaux et Microenvironnement (LMSM) de l’Université de Rouen Normandie dans le cadre d’un projet soutenu par la région Normandie (programme RNAmb) atteignent des puissances énormes (120 To pour le serveur lui-même et 240 To pour la baie de sauvegarde).

Cet équipement complétera les équipements du LMSM qui dispose déjà d’un serveur de taille plus « petite » (12 To + 20 To de sauvegarde) destiné à une autre approche aujourd’hui essentielle en microbiologie, la modélisation moléculaire. Cette technique consiste à créer des modèles en 3 dimensions de molécules d’intérêt et à en étudier sur ordinateur les capacités d’interaction avec d’autres substances. On réalise ainsi en numérique, et des milliers de fois plus vite, les essais qu’on devait réaliser auparavant expérimentalement. Ce ce que l’on appelle l’interactomique.

Plus classiquement, les microbiologistes étudient et comparent la séquence des protéines produite par des micro-organismes. C’est ce que nous réalisons grâce à une technique de spectrométrie de masse dite par « désorption laser assistée par matrice », (en anglais MALDI-TOF), qui consiste à fractionner les protéines et à séparer les fragments en fonction de leur masse et de leur charge. Bien sûr, là aussi, la quantité de données recueillies nécessite la puissance d’un outil numérique, d’abord pour reconstituer les protéines, puis pour les comparer avec une banque de données afin de les identifier. On parle ainsi de protéomique et contrairement à ce que suggère la série « Les Experts », cela peut prendre des jours ou des semaines de travail !

Plus récemment cette technique d’analyse MALDI-TOF a été adaptée pour étudier une autre famille de molécules produites par les micro-organismes, les lipides. Ces substances connues de tous sous le nom de « graisses » constituent l’enveloppe de toutes les cellules vivantes et l’on commence à en comprendre le rôle essentiel dans l’adaptation à des bactéries à leur environnement. S’agissant de l’analyse de lipides on parle de _lipidomique.

La métagénomique, l’interactomique, la protéomique, la lipidomique, toutes ces techniques dites « Omiques » sont aujourd’hui les principaux outils de la microbiologie et leur évolution est étroitement liée à celle des outils numériques. Ils sont fortement implantés en Normandie, en particulier au travers du LMSM et du Centre de sécurité sanitaire de Normandie inauguré sur Évreux en 2017. Ces moyens numériques sont aujourd’hui des outils indispensables pour mieux comprendre comment les bactéries peuvent se développer en harmonie avec le reste de l’organisme et l’environnement ou au contraire devenir pathogènes, ce qui, en fait, est heureusement plus l’exception que la règle.