Les protéines

Pour comprendre comment modéliser une protéine, il faut nous attarder un instant à ce qu'est une protéine.
Une protéine est un élément particulier de toute cellule vivante (animale, végétale, bactérienne...), crée grâce au décodage d'un code inscrit dans l'ADN (voir ici). Ce code permet d'associer à 3 acides nucléiques un acide aminé.
La formation d'une protéine n'est toutefois pas simplement cet alignement d'acides-aminés, et on parle de 4 structures protéiques bien distinctes :

  1. la structure primaire : correspond à la séquence d'acides-aminés
  2. la structure secondaire correspond en un repliement local de cette chaîne d'acides-aminés (on parle d'hélice alpha et de feuillet béta, en majorité)
  3. la structure tertiaire correspond au repliement de la chaîne secondaire dans l'espace. C'est la structure 3D, celle qui nous intéresse ici en particulier.
  4. la structure quaternaire correspond à l'association de plusieurs structures tertiaires appelées ici sous-unités ou mères. On parle d'hétéromère quand les structures sont de nature différente, et de monomère quand les sous-unités sont identiques.

structureProt

L'étude d'une protéine...

Comme certains doivent le savoir, la biologie est un domaine scientifique toujours en évolution. L'étude des protéines ne fait pas exception. En effet, pour étudier une protéine, il faut non-seulement l'isoler (on parle de purification), étudier sa fonction (=son activité) mais il faut aussi connaître sa structure, c'est-à-dire :

  • voir comment sa séquence s'organise en 3D
  • voir si elle a des domaines d'interaction avec d'autres protéines
  • voir si elle agit toute seule
  • voir où elle s'accroche dans la cellule
  • ...

Toutes ces questions nécessitent des réponses qui ne sont pas simples à trouver. En particulier, résoudre la structure 3D passe par une étude compliquée de cristallisation et d'étude des cristaux via les rayons X (désolée pour les puristes, je résume beaucoup je sais...). Or, le problème principale ici réside dans le fait que de nombreuses protéines sont difficilement ou ne sont pas cristallisables.

La prédiction de structure...

Ainsi, et pour prédire la structure des protéines (je parle ici surtout des structures III), la bioinformaticien joue sur l'homologie des protéines, c'est-à-dire qu'il étudie la protéine à définir avec toutes celles qui, d'un point de vue évolution, lui ressemblent. Si parmi des protéines homologues, une protéine a été caractérisée et que sa structure est connue, il va comparer, à la manière du phylogénéticien, les séquences en acides-aminées. Toutefois, ici l'évolution de l'intéresse pas et il concentre ses efforts sur les différences / ressemblances observables sur la séquence pour en déduire la structure.

Tel domaine est identique et correspond à telle structure : donc ma protéine se replie de telle façon à cet endroit...

Les missions du "prédicateur"...

  1. Trouver des séquences homologues c'est-à-dire fouiller dans les banques de données publiques de protéines
  2. Comparer les séquences grâce à l'œil biologique mais aussi grâce à des outils logiciels sophistiqués.
  3. Dans le cas de domaines différents, déduire la structure grâce à des logiciels qui étudie la composition en acides-aminés du domaine, et permette de poser des hypothèses quant aux différentes structures possibles
  4. Modéliser la protéine en gardant à l'esprit que seule une vérification expérimentale prouve le bien fondé de cette modélisation

Comme tout prédicateur, sa parole ne fait pas foi mais permet d'avancer dans la connaissance en attendant que la science soit véritablement capable expérimentalement d'inférer ou non cette prédiction...