Ma vie, mon métier.... : Ingénieur bases de données biologiques !
Par Evelyne Duvernois le jeudi 31 janvier 2008, 15:21 - Ma vie, mon métier... - Lien permanent

Comme le disait il n'y a pas si longtemps Julien ici, sa série "Un jour, un métier..." est dédiée à la description d'une des facettes du métier d'ingénieur en génie industriel.
Pour ma part, j'ai créé la série "Ma vie, mon métier..." pour vous parler plus profondément du métier de bioinformaticien actuellement en France. J'espère que Julien ne m'en voudra pas trop de m'être honteusement inspiré son titre de série...
Et pour commencer cette série, je vais parler de ce que je fais tous les jours depuis maintenant 2 mois : créer et gérer des bases de données biologiques.

Qu'est-ce qu'une base de données ?
Pour commencer, commençons bien et commençons par le début ! Savez-vous exactement ce qu'est une base de données et à quoi cela sert ? Si la réponse est non, ce petit paragraphe va remplir ces inconnues avec quelques notions essentielles à la compréhension du métier.
Une base de données est une structure très commune, permettant de rassembler au sein d'une même entité un ensemble de données ayant une cohérence entre-elles. Les bases de données se retrouvent dans le milieu de la biologie mais aussi dans tous les milieux professionnels, de la banque à l'hotellerie, en passant par le milieu de la recherche internationale.
Le but d'une base de données est d'avoir :
- accès simultanée aux données par plusieurs postes
- grande capacité de stockage
- une gestion plus facile (pas besoin de recouper 25 fichiers différents) : centralisation des données + confidentialité
PS: pour les puristes, je ne ferais pas le distingo ici entre base et banques de données
Les missions de l'ingénieur
La mission principale ici est, bien évidemment, de créer la base de données demandées mais cela passe par plusieurs phases qui ne sont pas forcément toutes rencontrées par des ingénieurs informaticiens.
- Rencontrer les chercheurs : une base de données biologiques n'est correcte que si elle a été créée en adéquation avec le monde scientifique. Il ne sert à rien de refaire ce qui a déjà été fait et il ne sert à rien de faire ce qui ne servira pas. Ainsi, il faut de nombreuses discussions avec les chercheurs qui sont à l'origine du projet pour comprendre leurs attentes et comprendre à quoi pourra et devra servir la base.
- Vérifier la localisation des données : Les données biologiques sont multiples : elles sont "trouvées" sur des publications, générées automatiquement via des règles précises (synthèse dite in silico), ou calculées (exemple : masse des composés). Le but est donc, avant la création de toute base, d'analyser le type de données nécessaires et de vérifier où trouver ces données. Lors un cas récent auquel j'ai dû faire face, le but était de créer une base regroupant des informations présentes sur plusieurs supports au sein d'une même structure, ceci afin de simplifier les interrogations.
- A la mode informatique : Une fois que ces étapes sont réalisées, nous nous changeons alors en véritable informaticien, et nous réfléchissons au schéma de la base, et nous commençons notre codage. Ce qu'il faut néanmoins savoir est que la majorité des biologistes ne connaissent pas la langage des bases de données (SQL) et qu'il faut prévoir un outil de requêtage pour eux, avec une interface conviviale.
Pourquoi un bioinformaticien pour ce travail ?
Il est vrai que la création d'une base de données peut parraître spécifique des informaticiens "purs". Toutefois, il faut considérer ici que les biologistes ne parlent pas le langage informatique et que le dialogue entre 2 personnes ne comprenant pas le monde de l'autre est difficile.
Un bioinformaticien a pour capacité de comprendre les 2 mondes, sans pour autant être excellent dans les 2 domaines. Sa spécificité est ici d'être multi-thématique et d'avoir une forte capacité d'adaptation.
De plus, pour comprendre comment construire sa base de données "biologiques", il faut comprendre les données, et pouvoir dégager des tables d'intérêt, à la fois pour permettre d'interroger facilement la base mais aussi que les entités crées aient biologiquement du sens.
Exemple de bases de donnes "biologiques"
- PubMed regroupe les papiers publiés
- Uniprot KB regroupe des informations sur les protéines
- PubChem regroupe des informations sur des éléments chimiques
- ... et encore bien bien d'autres...




Commentaires
Je te rassure tout de suite, il n'y a aucun copyright sur mon titre. Tu peux t'en inspirer comme tu veux.
Billet intéressant ^^
Est-ce facile de disucter avec les chercheurs sur des sujets relatifs aux base de données ?
Parce que je me doute que le langage typement "informatique" ne leur est pas compréhensible tout de suite, non?
C'est bien pour cela qu'on parle "biologique" avec des biologistes...
Non, je rigole... Ce n'est pas compliqué, il suffit de bien expliquer les choses, de mettre le temps qu'il faut lors des réunions pour poser les problèmes "techniques" dont la réponse est "biologique".
Globalement, il n'y a pas de problème. Mais il faut de temps en temps se tourner vers de vrai informaticien si le problème à résoudre est véritablement technique.
C'est très intéressant, et l'on comprend de mieux en mieux ton métier.
Y-a-t-il des bases de données en français, ou sont-elles toutes en anglais, biology oblige?
Très bon blog, ça fait plaisir d'entendre parler de la bioinformatique.
Véronique
*************
Pour ce qui est des bases de données "françaises", je ne connais que celles développées au sein même d'un laboratoire pour utilisation personnelle, et encore.
En effet, l'usage veut que tout soit en anglais, à la fois par habitude mais surtout parce que tous les collaborateurs d'une équipe ne sont pas forcément francophones.
Florent
********
Merci beaucoup de ton soutien... J'espère pouvoir développer ce blog de mieux en mieux
Je crois qu'il vaut mieux parler de la mission de l'ingénieur de base de donnée en général.
@ Noureddine
La mission d'un ingénieur base de données serait intéressant dans la mesure où ce blog serait dédié à l'informatique générale. Or le but ici est de faire découvrir mon métier en général et les différentes missions que l'on peut donner à un bioinformaticien. Je n'ai pas pour vocation ni ambition de me présenter en tant qu'informaticienne pure et dure, je ne le suis en aucun cas. Je suis bioinformaticienne et cette catégorie avait pour vocation première de faire découvrir les différentes facettes de mon métier...
En espérant avoir pu te répondre...