Les ontologies.... Ça fait un peu nom barbare vous ne trouvez pas ? Mais qu'est-ce que ça peut bien être...
En fait, décrire une ontologie, il n'y a rien de plus simples, et ce terme n'est pas limité à l'usage "bioinformatique". Il faut imaginer une sorte de dictionnaire hiérarchisé, qui décrit un ensemble d'éléments de même nature. Trop compliqué ? Je vais reprendre tout ça !

Un peu d'histoire...

Le terme d'ontologie n'est pas récent, puisque ses premières allusions remontent au grec ancien, avec le terme oντος qui signifie : "étude le l'être en tant qu'être" (merci wikipedia)... En clair, une ontologie étudie les propriétés générales de ce qui existe.
Ce terme a alors été repris dans les domaines de l'étude de l'information, donc de l'informatique en générale, où ontologie désigne un ensemble structuré de termes et concepts qui ont un sens autour d'un thème donné. Une ontologie est donc un modèle de données représentatif d'un ensemble de concepts autour d'un sujet donné ainsi que des relations que ces concepts ont les uns par rapport aux autres.

Utilisation d'ontologies, quel est l'objectif...

Les utilisations des ontologies interviennent dans de multiples domaines, du génie logiciel à l'intelligence artificielle, et naturellement, en bioinformatique. Le but est de modéliser un ensemble de connaissances pour un domaine donné. Ainsi, les termes utilisés dans le domaine ne sont pas indépendants des autres, mais les relations entre concepts sont connus et détaillés...
D'après Thomas Gruber, cinq critères permettent de mettre en évidence des aspects importants d'une ontologie :

  • La clarté : un définition fait sens, doit être objective et la plus complète possible ainsi que documentée
  • La cohérence : pas de contradiction possible
  • L'extensibilité : les extensions doivent être anticipées. On ne doit pas interférer dans le fondement d'une ontologie
  • Une déformation de l'encodage minimal : l'influence de la spécification sur la conceptualisation doit être évitée autant que possible
  • Un engagement ontologique minimal : une ontologie ne définit que les termes nécessaires, c'est un vocabulaire, elle ne répond pas à toutes les questions du domaine.


Utilisation en bioinformatique

Les ontologies en bioinformatique, ou devrais-je plutôt dire en biologie, sont très utilisées, en particulier pour couvrir le domaine des gènes ou des protéines. En effet, il existe plusieurs façons de décrire la fonction d'un gène. Pour l'une des bases de données les plus connues d'ontologies appelées the Gene Ontology ou GO, il existe 3 fonctions possibles :

  1. la fonction moléculaire ou molecular function : décrit une activité qui intervient au niveau moléculaire
  2. le processus biologique ou biological process : décrit une série d'événements réalisés par un ou plusieurs assemblages ordonnés de molécules
  3. la localisation cellulaire ou cellular component : décrit les composants cellulaires, d'un organite à tout un organe

Chaque gène ou protéine a donc une ou plusieurs fonctions au niveau de ces "types de fonction".

Par exemple, en prenant la protéine ACTN1: Alpha-actinin-1 humaine, on trouve plusieurs fonctions possibles : GO ACTN1
source : screenshot d'un résultat de recherche sur Actin, filtre H. sapiens, par le Browser AmiGO de la Gene Ontology. Le résultat a été coupé pour des problèmes de place et de visibilité du résultat.

Deux relations entre les termes sont possibles sous GO : part_of ou is_a décrivant l'existence de sous-classes, avec pour particularité pour part_of que l'élément primaire n'est pas forcément présent dans l'ontologie. Ces relations peuvent être représentées sous la forme d'arbres comme celui présenté plus bas, pour une recherche sur l'activité omega12-desaturase dans les biological process (n° GO : GO:0042389).
O12Des_GO

En espérant que ce petit "intermède technique" vous a plu, je vous souhaite une bonne continuation de lecture de mon blog...
A bientôt pour de nouvelles aventures !