Un gène humain sur cinq n'est pas `` réel ''

De nouvelles recherches pourraient changer le visage de la biomédecine; on constate que le génome humain contient beaucoup moins de gènes «réels» ou codant pour des protéines qu'on ne le croyait auparavant.

Notre ADN peut contenir beaucoup moins de gènes «réels» que nous ne l’avions initialement pensé.

Au début des années 1990, les scientifiques ont entrepris de cartographier la séquence complète d'ADN du génome humain.

Le soi-disant projet du génome humain visait à trouver des liens génétiques avec des maladies et à comprendre la fonction et la structure de divers éléments du génome, tels que quels gènes codent pour des protéines et quels facteurs régulent l'expression des gènes.

Les premiers résultats du projet sur le génome humain ont prédit que 40 000 gènes peuvent coder pour des protéines, de grosses molécules vitales pour le bon fonctionnement des tissus et des organes du corps.

Cependant, à la fin de ce projet en 2003, les estimations de ce nombre sont tombées à environ 20 000 à 25 000 gènes codant pour des protéines.

Depuis lors, les scientifiques se sont efforcés de trouver le protéome final - c'est-à-dire le nombre total de protéines pouvant être exprimées par des gènes - et se sont concentrés sur la compréhension de la mutation de l'expression génétique de ces protéines dans plusieurs maladies.

À cette fin, une équipe internationale de chercheurs dirigée par Michael Tress, de l'Unité de bioinformatique du Centre national espagnol de recherche sur le cancer à Madrid, en Espagne, a maintenant examiné les gènes considérés comme codant pour des protéines par les principales bases de données de protéome disponibles.

Tress et ses collègues ont publié les résultats de leurs recherches dans la revue Recherche sur les acides nucléiques. Federico Abascal, du Wellcome Trust Sanger Institute à Hinxton, Royaume-Uni, est le premier auteur de l'article.

Au moins 2 000 gènes sont des «pseudogènes»

Les chercheurs ont comparé les protéomes de trois collections de séquences protéiques et d'annotations génétiques: GENCODE / Ensembl, RefSeq et UniProtKB.

Tress et son équipe ont constaté que, sur le nombre total de 22 210 gènes répertoriés comme codant pour les protéines, seuls 19 446 figuraient dans les trois collections.

Ensuite, ils ont zoomé sur la différence de 2764 gènes, examinant les preuves expérimentales et les informations disponibles à partir des annotations.

Les preuves suggèrent que la majorité de ces gènes étaient des «gènes ou pseudogènes non codants».

En outre, les scientifiques ont découvert que 1 470 gènes supplémentaires - qui étaient répertoriés comme codant pour les protéines dans les trois collections - n'avaient pas les caractéristiques fonctionnelles ou l'évolution typique des gènes codant pour les protéines.

Par conséquent, les chercheurs «pensent que les trois bases de données de référence surestiment actuellement le nombre de gènes codants humains d'au moins 2 000, ce qui complique et ajoute du bruit aux expériences biomédicales à grande échelle».

«Déterminer quels gènes non codants potentiels ne codent pas pour les protéines est une tâche difficile mais d'une importance vitale car le protéome de référence humain est un pilier fondamental de la plupart des recherches fondamentales et soutient presque tous les projets biomédicaux à grande échelle.

Orientations pour les recherches futures

Tress explique comment les chercheurs approfondissent leurs découvertes. «Nous avons pu analyser en détail nombre de ces gènes», explique-t-il, «et plus de 300 gènes ont déjà été reclassés comme non codants.»

«Étonnamment», dit le co-auteur de l'étude David Juan, «certains de ces gènes inhabituels ont été bien étudiés et ont plus de 100 publications scientifiques basées sur l'hypothèse que le gène produit une protéine.»

Les résultats pourraient donc changer le domaine de la biomédecine tel que nous le connaissons. Cependant, des recherches supplémentaires sont nécessaires.

«Nos preuves», ajoute Abascal, «suggèrent que les humains ne possèdent peut-être que 19 000 gènes codants, mais nous ne savons toujours pas quels [ces] 19 000 gènes sont».

none:  troubles de l'alimentation cancer des ovaires épilepsie