• Réduire le texte

    Réduire le texte
  • Rétablir taille du texte

    Rétablir taille du texte
  • Augmenter le texte

    Augmenter le texte
  • Imprimer

    Imprimer
Bactérie d'Escherichia Coli? vue au microscope électronique. La barre d'échelle représente 1 µm.. © Inra, DUCLUZEAU Robert

Biologie de synthèse : mieux comprendre la production de protéines et la croissance bactérienne

Grâce aux nouvelles technologies de synthèse et de séquençage de l’ADN, une équipe de chercheurs de l’Inra et de l’Université de Berkeley (Etats-Unis) a reprogrammé 244 000 séquences génétiques pour comprendre les impacts respectifs de différentes propriétés des gènes sur l’efficacité de leur propre traduction en protéines chez la bactérie modèle Escherichia Coli. Ces travaux, publiés dans la revue Nature Biotechnology le 24 septembre 2018, ont permis d’identifier des règles générales d’optimisation de l’expression protéique, une étape fondamentale pour la compréhension des systèmes vivants, et démontrent la possibilité de mettre en place de gigantesques plans expérimentaux à l’échelle moléculaire de l’ADN.

Mis à jour le 02/10/2018
Publié le 25/09/2018

Le lien entre les séquences génétiques et leur manifestation phénotypique est longtemps resté limité à l’étude de variations naturelles. Le développement récent de technologies de synthèse et de séquençage de l’ADN à très haut-débit ouvre de nouvelles perspectives. La biologie synthétique repose largement sur l’assemblage de composants génétiques standard, en faisant abstraction des complexités de leur fonctionnement interne. Or certains éléments génétiques ne se prêtent pas à cette approche : leur fonctionnement doit alors être compris en détail. C’est notamment le cas des protéines, ces machines moléculaires qui assurent des fonctions très précises et doivent donc être adaptées à la finalité de chaque processus biologique ou application biotechnologique (production de molécule d’intérêt, détection de signaux, détoxification). Or, on sait que la séquence codant une protéine influence grandement son niveau d’expression, sans pour autant que l’on sache l'expliquer.

L’étude de telles relations entre génotype et phénotype est longtemps restée confinée à l’analyse de la variabilité naturelle ou générée au hasard au laboratoire, limitant notre compréhension fine des mécanismes génétiques. Il est depuis peu possible de programmer précisément un très grand nombre de séquences d’ADN par synthèse chimique, ce qui offre la possibilité d’interroger le fonctionnement des systèmes vivants de manière plus précise que jamais.

   

244 000 séquences d’ADN synthétisées pour mieux comprendre la production des protéines

Une équipe de chercheurs de l’Inra et de l’Université de Berkeley (Etats-Unis) a ré-analysé génome et données fonctionnelles publiquement disponibles sur Escherichia coli, principal modèle bactérien. Cela a permis aux scientifiques d’identifier huit propriétés de l’ADN susceptibles d’influencer la traduction des protéines. Ils ont ensuite développé un outil informatique capable de générer automatiquement des séquences explorant exhaustivement toutes les combinaisons possibles de ces propriétés. Pas moins de 244 000 de ces séquences ont été traitées. Mises bout à bout, l’ensemble de ces séquences représente près de 6 fois la taille du génome de la bactérie. Ces séquences ont ensuite été introduites chez E. coli, permettant ainsi l’obtention d’une population de bactéries variantes, dans laquelle chacune des séquences synthétiques est représentée.

D’astucieux recours au séquençage à haut-débit leur a alors permis de mesurer le phénotype associé à chacun de ces variants en une seule expérience, occasionnant ainsi un gain de coût, de temps et de reproductibilité. Les chercheurs ont ainsi pu mesurer l’influence des séquences synthétiques sur 1)la production et la stabilité d’ARN messagers, 2)le nombre de ribosomes qui leur sont associés, 3)la production protéique en résultant et enfin sur 4)l’impact de l’ensemble de ces phénomènes sur la croissance bactérienne.

   

Des règles pour optimiser la production de protéines

L’intégration et l’analyse du gigantesque jeu de données produit a permis de quantifier les contributions respectives et les relations de dépendances entre les propriétés de séquences identifiées lors de l’analyse initiale. En particulier, ces résultats montrent la très nette dominance des structures secondaires (issues du reploiement des ARN messagers sur eux-mêmes) sur l’ensemble des phénotypes observés, au détriment d’une autre propriété, l’usage de codon, qui est pourtant généralement considérée comme primordiale. Ces analyses ont permis d’édicter un ensemble de règles pour optimiser la production de protéines à moindre coût pour la cellule.

Malgré la quantité des données accumulées dans un cadre cohérent et contrôlé, les chercheurs notent qu’il reste difficile de prédire avec précision le comportement de l’ensemble des séquences. Cette observation souligne l’extrême complexité des relations entre séquences, activité biologique et physiologie. Le chemin menant à une biologie vraiment prédictive reste long, en raison notamment de la complexité des processus sous-jacents, et des limites actuelles en intelligence artificielle par exemple.

Forts de leur expérience, les chercheurs de l’Inra envisagent désormais d’appliquer ce type d’approches à l’étude approfondie de petits virus d’insecte susceptibles d’être utilisés en lutte biologique contre des ravageurs de culture (chenille légionnaire d’automne, Spodoptera frugiperda) et des vecteurs de maladies (moustique tigre, Aedes albopictus).

    

Résumé graphique de l’approche à travailler sur ce modèle. © Inra
© Inra

Contact(s)
Contact(s) scientifique(s) :

  • Guillaume Cambray (04 67 14 41 19 ) Université mixte de recherche « Diversité, Génomes et Interactions Microorganismes-Insectes » (Inra – Université de Montpellier)
Contact(s) presse :
Inra service de presse (01 42 75 91 86)
Centre(s) associé(s) :
Occitanie-Montpellier

Référence

Cambray, G, Guimaraes, J. & Arkin A.P. Evaluation of 244,000 synthetic sequences reveals design principles to optimize translation in Escherichia ColiNature Biotechnology, https://doi.org/10.1038/nbt.4238