Informations

Quelle est la différence entre les régions non codantes et intergéniques ?

Quelle est la différence entre les régions non codantes et intergéniques ?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

La question initiale était de comprendre ce qu'il y a en aval d'un gène dans un organisme eucaryote. Je comprends que cette région est située en 3' d'un gène, et donc je m'attendrais à trouver des régions non codantes, mais y a-t-il une différence entre les régions non codantes et une région intergénique ?

Un petit aperçu de ce que je fais : j'étudie l'effet des rétrotransposons dans les populations de S. cerevisiae, et j'ai déjà identifié les impacts potentiels de ces rétrotransposons et voici les conséquences :

Variante de gène en amont 49 Variante de gène en aval 42 Variante intergénique 4 Ablation de transcription 3 Variante de séquence codante 1 Allongement de caractéristique 1 Variante d'UTR 3' 1

Alors est-il malin de dire qu'en aval d'un gène il y a des gènes non-codants ?


"Intergénique" est, eh bien, un embarras, bien qu'il puisse être difficile à éviter. Intergénique signifie, littéralement, entre les gènes. Les gènes sont, comme vous vous en doutez, génétiquement défini comme des régions du chromosome avec un certain rôle génétique. Entre les gènes, nous avons, eh bien, de la camelote, du spam, sans signification ni signification, puisque sinon, ce serait un gène. Dans les années 1990, tout le monde savait que la majeure partie du génome était de l'« ADN indésirable » et c'était assez simple. Et le dogme central était que l'ADN fait que l'ARNm fabrique la protéine et s'il n'y avait pas de protéine fabriquant l'ARNm, ou même pas longue protéine, puis ils ont supposé qu'il n'y avait pas de gène.

Eh bien, le problème avec l'utilisation de ces termes de nos jours est, d'abord, qu'il est très difficile de montrer un morceau d'ADN donné. jamais a un rôle. Après tout, vous pouvez souvent supprimer un gène entier sans effet visible sur un organisme, alors comment une séquence non codante «entre les gènes» peut-elle être prouvée de manière concluante comme étant dénuée de sens et sans rapport avec l'un de ses voisins ? Et deuxièmement, l'ADN définitivement Est-ce que avoir un rôle même si tout ce qu'il fait est de produire de l'ARN non codant, ou agit comme une séquence régulatrice qui le fait. Ainsi, par exemple, sur OMIM, vous pouvez rechercher de nombreux enregistrements pour "intergénique", avec des résultats comme H19, pour lesquels un terme est "LONG INTERGENIC NONCODING RNA H19". Notez également que H19 est répertorié comme le symbole du gène approuvé par HGNC, il s'agit donc d'un gène intergénique. Difficile, hein ? (J'ai un grand respect pour OMIM - ce n'est pas de leur faute) De plus, les amplificateurs peuvent être assez éloignés d'un gène, même après la fin d'un autre gène ou affectant plusieurs gènes, donc même si une mutation dans l'amplificateur peut génétiquement agir comme un allèle d'un gène spécifique, il pourrait être décrit en termes de séquence comme situé dans une région intergénique.

Conclusion : les régions intergéniques sur lesquelles vous lisez se situeront entre des éléments reconnus comme des gènes et peuvent ou non être connus pour avoir un effet sur l'un ou l'autre (ou les deux...). Ils ne contiendront pas de CDS, qui est toujours considéré comme un gène, ni 5'UTR ou 3'UTR car ceux-ci sont transcrits avant ou après un CDS. Au-delà de cela, comment ils sont distingués de la "séquence amont" et de la "séquence aval", cela pourrait être complètement arbitraire. Ils sont peut-être allés sur WormBase et ont extrait des enregistrements génétiques sélectionnés et ont ajouté un certain nombre de paires de bases avant le site de départ en tant que promoteur - mais je ne le sais pas. Vous n'aurez qu'à essayer de trouver la référence particulière de l'outil que vous utilisez.


Une région intergénique n'est qu'un des nombreux types de séquences non codantes.

D'autres incluent :

  • promoteurs
  • sites de liaison réglementaires
  • terminaisons
  • introns
  • aptamères
  • sites d'entrée des ribosomes

Il y a un parcelle de choses qui font partie des gènes en plus de la séquence codant pour la protéine.

Un bon moyen d'avoir une idée du genre de choses qu'il y a en plus des régions de codage est de parcourir l'ontologie de séquence. Si vous naviguez jusqu'à la séquence codante et commencez à parcourir les termes parents et cousins, vous en trouverez un grand nombre comprenant toutes les choses que j'ai mentionnées ci-dessus, ainsi que la région intergénique, avec des définitions associées à l'oreille.


Quelle est la différence entre les régions non codantes et intergéniques ? - La biologie

Un Intergénique La région est un tronçon de séquences d'ADN situé entre des groupes de gènes qui contiennent peu ou pas de gènes. Parfois certains intergénique L'ADN agit pour contrôler les gènes à proximité, mais la plupart d'entre eux n'ont actuellement aucune fonction connue. C'est l'une des séquences d'ADN collectivement appelées ADN indésirable, bien qu'il ne s'agisse que d'un phénomène étiqueté comme tel et scientifiquement.
Article complet >>>

Intergénique résumé de la région avec 2 pages d'entrées d'encyclopédie, essais, résumés, . Analyse de 16S-23S intergénique régions d'espacement des opérons d'ARNr.
Article complet >>>

Cela suggère que intergénique les transcriptions sont soumises à des contraintes fonctionnelles. En général, intergénique les transcriptions ont tendance à être exprimées à de faibles niveaux, parfois .
Article complet >>>

20% de intergénique régions, se produisent souvent en touffes et sont rares . Pour trouver des orthologues intergénique régions, nous avons recherché des paires de .
Article complet >>>

L'ADNr 16S-23S intergénique entretoise varie de manière plus significative en taille et . Hétérogénéité parmi les ARNr 16S-23S intergénique espaceurs d'espèces dans le ` .
Article complet >>>

Informations encyclopédiques sur Intergénique ADN. le nom l'indique, intergénique L'ADN fait référence à . Modèles de contraintes évolutives dans Intronic et Intergénique ADN.
Article complet >>>

En amont intergénique les régions ont été extraites des séquences du génome à l'aide d'un PERL. Intergénique les séquences peuvent ensuite être obtenues par copier-coller COGSearch .
Article complet >>>

Informations sur la zoologie, histoire, articles et recherches dans des revues académiques, des journaux et des magazines sur HighBeam.com. Essai gratuit, carte de crédit requise.
Article complet >>>

En comparaison avec le intergénique espaceur locus et d'évaluer la liaison. Deux des liés intergénique les génotypes spacer et p66 étaient uniques à l'espèce.
Article complet >>>

Nous avons généré un ensemble de 66 intergénique séquences dans Arabidopsis lyrata, une fin . Les intergénique les régions comprenaient des restes et des régions d'éléments transposables (TE).
Article complet >>>

plus problématique pour intergénique régions des génomes nucléaires des plantes, car les plantes . En théorie orthologue intergénique les données sont précieuses pour l'étude.
Article complet >>>

Détails sur la mutation génétique, intragénique, Intergénique, mutations ponctuelles, capacités enzymatiques, séquence de base normale, molécule d'ADN . peut être intragénique ou intergénique. .
Article complet >>>

Les flèches soulignent les trois séquences répétitives trouvées dans ce intergénique Région. . ( B) Représentation schématique du intergénique Région. .
Article complet >>>

La clé d'E. coli. Dr Sophie Bachellier a une page web pour les IRU (Intergénique Unités répétées ) . située dans le intergénique régions de bactéries.
Article complet >>>

PLoS ONE : une ressource inclusive, évaluée par des pairs et en libre accès du PUBLIC . Conservé intergénique les séquences sont identifiées en comparant les IGR du .
Article complet >>>

. recherche dans le génome d'E. coli pour intergénique régions d'identité de séquence élevée. Roman intergénique répétitions d'Escherichia coli K-12". Res. Microbiol. .
Article complet >>>

de nombreux intergénique régions serait trop élevé. conservé parmi les espèces sensu stricto à . de S. cerevisiae que leur intergénique séquences.
Article complet >>>

Intergénique les séquences ont été prélevées au hasard sur les 24 chromosomes de l'humain. kit de formation inclus 12 000 intergénique fragments et 12 000 fragments PET. .
Article complet >>>

Bibliothèque BioInfoBank :: ADN, Intergénique :: physiologie :: [Séquences non codantes du génome eucaryote comme protection supplémentaire des gènes contre les mutagènes chimiques] .
Article complet >>>

Caractérisation de la intergénique Profil d'ARN au niveau abdominal-A et abdominal-B dans . Ces observations suggèrent que la intergénique Les ARN peuvent jouer un rôle dans .
Article complet >>>


Différences entre les régions codantes et non codantes dans le Trichomonas vaginalis génome : un gène d'actine comme locus modèle 1

La séquence d'un fragment génomique cloné de Trichomonas vaginalis contenant un gène d'actine complet a été déterminé. Un cadre de lecture ouvert ininterrompu de 1128 nucléotides a été trouvé qui code pour un gène d'actine. Deux séquences de promoteur consensus chevauchées pour T. vaginalis ont été trouvés 12 nucléotides en amont du codon d'initiation de l'actine. En plus de l'actine, deux cadres de lecture ouverts incomplets ont été trouvés aux extrémités 5' et 3' du clone. Ces deux séquences sont exprimées et ont montré une similitude avec les gènes de l'adénylate cyclase et une protéine hypothétique de levure. La séquence globale a montré une teneur en G+C plus élevée et une fréquence plus faible de séquences répétées dans les régions codantes par rapport aux régions non codantes. Une distribution inégale similaire de nucléotides a été trouvée dans divers T. vaginalis gènes extraits des bases de données.


Diversité microbienne fonctionnelle en environnement contaminé et application en bioremédiation

Satyanarayan Panigrahi , . Toleti Subba Rao, dans Diversité microbienne à l'ère génomique, 2019

21.2.2.7 Analyse des espaceurs intergéniques ribosomiques (RISA)

L'analyse de l'espaceur intergénique de l'ARNr (RISA) est une méthode d'analyse de la communauté microbienne qui implique l'amplification par PCR d'une région de l'opéron du gène de l'ARNr entre la petite (16S) et la grande (23S) sous-unités ( Fisher et Triplett, 1999 ) appelée région de l'espaceur intergénique ( ISR) (Fig. 21.8).

Graphique 21.8. Analyse des espaceurs intergéniques ribosomiques un aperçu typique.

En utilisant des amorces oligonucléotidiques ciblées sur des régions conservées dans les gènes 16S et 23S, des fragments RISA peuvent être générés à partir de la plupart des bactéries dominantes dans un échantillon environnemental. La majorité de l'opéron d'ARNr sert une fonction structurelle. Des parties de la région intergénique 16S-23S peuvent coder des ARNt en fonction de l'espèce bactérienne. Cependant, la valeur taxonomique de l'ISR réside dans l'hétérogénéité significative à la fois de la longueur et de la séquence nucléotidique. Les ISR sont compris entre 150 et 1500 pb, la majorité des longueurs d'ISR étant comprises entre 150 et 500 pb. La version automatisée de RISA est connue sous le nom d'ARISA et implique l'utilisation d'une amorce directe marquée par fluorescence, et les fragments ISR sont détectés automatiquement par un détecteur laser. ARISA permet l'analyse simultanée de nombreux échantillons, mais il a été démontré que la technique surestimait la richesse et la diversité microbiennes ( Fisher et Triplett, 1999 ). Le RISA a été utilisé pour détecter les populations microbiennes impliquées dans la dégradation des hydrocarbures aromatiques polycycliques à basse température dans des conditions de sol enrichies aérobies et réduisant les nitrates ( Eriksson et al., 2003 ). Il a été observé que la dominance des bactéries appartenant aux protéobactéries alpha, bêta et gamma présentes dans les enrichissements a été mise en culture avec succès. Une étude récente a utilisé ARISA pour étudier la diversité des bactéries dégradant les hydrocarbures et la réponse des communautés bactériennes dans les sables de plage contaminés par des déversements de pétrole dans le golfe du Mexique ( Kostka et al., 2011 ). Les auteurs ont observé une abondance accrue de séquences d'Alcanivorax dans le sable contaminé par le pétrole. Randjard et al. (2001) ont utilisé ARISA pour caractériser les communautés bactériennes de quatre types de sols différents.


Définition

L'ADN codant fait référence à l'ADN du génome, contenant des gènes codant pour les protéines, tandis que l'ADN non codant fait référence à l'autre type d'ADN, qui ne code pas pour les protéines.

Pourcentage dans le génome

L'ADN codant ne représente que 1% du génome humain tandis que l'ADN non codant représente 99% du génome humain.

Composants

L'ADN codant se compose d'exons tandis que l'ADN non codant se compose d'éléments régulateurs, de gènes d'ARN non codants, d'introns, de pseudogènes, de séquences répétitives et de télomères.

Encodage pour les protéines

L'ADN codant code pour les protéines tandis que l'ADN non codant ne code pas pour les protéines.

Résultats de la transcription

L'ADN codant subit une transcription pour synthétiser des ARNm tandis que l'ADN non codant subit une transcription pour synthétiser des ARNt, des ARNr et d'autres ARN régulateurs.

La fonction des produits génétiques

Les protéines codées par l'ADN codant ont une importance structurelle, fonctionnelle et régulatrice dans la cellule, tandis que l'ADN non codant est important pour contrôler l'activité des gènes.

Conclusion

L'ADN codant est le type d'ADN dans le génome, codant pour les gènes codant pour les protéines. Généralement, ces gènes subissent une transcription pour synthétiser l'ARNm. Chez les eucaryotes, la région codante des gènes codant pour les protéines est interrompue par des introns, qui sont éliminés après transcription. Cependant, les ARNm subissent une traduction pour produire des protéines. De manière significative, les protéines jouent un rôle clé dans la cellule en servant de composants structurels, fonctionnels et régulateurs de la cellule. En revanche, l'ADN non codant est un autre type d'ADN, représentant environ 99% du génome. Cependant, il contient des gènes pour les ARN non codants, y compris les ARNt, les ARNr et d'autres ARN régulateurs, qui sont importants dans la traduction de l'ARNm. En outre, l'ADN non codant comprend des éléments régulateurs, des introns, des pseudogènes, des séquences répétitives et des télomères. Par conséquent, la principale différence entre l'ADN codant et l'ADN non codant réside dans le type de gènes présents et leurs produits géniques.

Les références:

1. « Qu'est-ce que l'ADN non codant ? – Genetics Home Reference – NIH. » Bibliothèque nationale de médecine des États-Unis, National Institutes of Health, disponible ici.

Image de courtoisie :

1. “Gene structure eucaryote 2 annotée” par Thomas Shafee – Shafee T, Lowe R (2017). “Structure des gènes eucaryotes et procaryotes”. WikiJournal de médecine 4 (1). DOI : 10.15347/wjm/2017.002. ISSN 20024436. (CC BY 4.0) via Commons Wikimedia
2. Mécanisme de boîte “TATA” Par Luttysar – Travail personnel (CC BY-SA 4.0) via Commons Wikimedia
3. “DNA to protein ou ncRNA” Par Thomas Shafee – Propre travail (CC BY 4.0) via Commons Wikimedia

À propos de l'auteur : Lakna

Lakna, diplômé en biologie moléculaire et biochimie, est biologiste moléculaire et s'intéresse de près à la découverte des choses liées à la nature.


Contenu

La quantité d'ADN génomique total varie considérablement d'un organisme à l'autre, et la proportion d'ADN codant et non codant au sein de ces génomes varie également considérablement. Par exemple, il a été initialement suggéré que plus de 98% du génome humain ne code pas pour les séquences protéiques, y compris la plupart des séquences dans les introns et la plupart des ADN intergéniques, [16] alors que 20% d'un génome procaryote typique est non codant. [3]

Chez les eucaryotes, la taille du génome, et par extension la quantité d'ADN non codant, n'est pas corrélée à la complexité de l'organisme, une observation connue sous le nom d'énigme de la valeur C. [17] Par exemple, le génome de la cellule unicellulaire Polychaos dubium (anciennement connu sous le nom Amibe dubia) a été rapporté pour contenir plus de 200 fois la quantité d'ADN chez l'homme. [18] Le poisson-globe Rubripes de Takifugu génome est seulement environ un huitième de la taille du génome humain, mais semble avoir un nombre comparable de gènes environ 90 % de la Takifugu le génome est un ADN non codant. [16] Par conséquent, la majeure partie de la différence de taille du génome n'est pas due à une variation de la quantité d'ADN codant, mais plutôt à une différence dans la quantité d'ADN non codant. [19]

En 2013, un nouveau « record » du génome eucaryote le plus efficace a été découvert avec Utricularia gibba, une plante de la vessie qui n'a que 3% d'ADN non-codant et 97% d'ADN codant. Des parties de l'ADN non codant étaient supprimées par la plante, ce qui suggère que l'ADN non codant n'est peut-être pas aussi critique pour les plantes, même si l'ADN non codant est utile pour les humains. [15] D'autres études sur les plantes ont découvert des fonctions cruciales dans des portions d'ADN non codant qui étaient auparavant considérées comme négligeables et ont ajouté une nouvelle couche à la compréhension de la régulation des gènes. [20]

Éléments cis- et trans-réglementaires Modifier

Les éléments cis-régulateurs sont des séquences qui contrôlent la transcription d'un gène voisin. Beaucoup de ces éléments sont impliqués dans l'évolution et le contrôle du développement. [21] Les éléments cis peuvent être situés dans des régions non traduites 5' ou 3' ou dans des introns. Les éléments trans-régulateurs contrôlent la transcription d'un gène distant.

Les promoteurs facilitent la transcription d'un gène particulier et sont généralement situés en amont de la région codante. Les séquences amplificatrices peuvent également exercer des effets très éloignés sur les niveaux de transcription des gènes. [22]

Introns Modifier

Les introns sont des sections non codantes d'un gène, transcrites dans la séquence d'ARNm précurseur, mais finalement éliminées par épissage d'ARN au cours de la transformation en ARN messager mature. De nombreux introns semblent être des éléments génétiques mobiles. [23]

Etudes des introns du groupe I de Tétrahymène les protozoaires indiquent que certains introns semblent être des éléments génétiques égoïstes, neutres pour l'hôte car ils se retirent des exons flanquants pendant le traitement de l'ARN et ne produisent pas de biais d'expression entre les allèles avec et sans l'intron. [23] Certains introns semblent avoir une fonction biologique importante, peut-être grâce à la fonctionnalité du ribozyme qui peut réguler l'activité de l'ARNt et de l'ARNr ainsi que l'expression des gènes codant pour les protéines, évidente chez les hôtes qui sont devenus dépendants de ces introns sur de longues périodes, par exemple, les trnL-intron se trouve dans toutes les plantes vertes et semble avoir été hérité verticalement pendant plusieurs milliards d'années, dont plus d'un milliard d'années dans les chloroplastes et 2 à 3 milliards d'années supplémentaires auparavant dans les ancêtres cyanobactériens des chloroplastes. [23]

Pseudogènes Modifier

Les pseudogènes sont des séquences d'ADN, liées à des gènes connus, qui ont perdu leur capacité de codage des protéines ou qui ne sont plus exprimées dans la cellule. Les pseudogènes résultent de la rétrotransposition ou de la duplication génomique de gènes fonctionnels et deviennent des « fossiles génomiques » qui ne sont pas fonctionnels en raison de mutations qui empêchent la transcription du gène, comme dans la région du promoteur du gène, ou altèrent fatalement la traduction du gène, comme des codons stop ou des décalages de cadre prématurés. [24] Les pseudogènes résultant de la rétrotransposition d'un intermédiaire d'ARN sont connus sous le nom de pseudogènes traités. Les pseudogènes issus des restes génomiques de gènes dupliqués ou de résidus de gènes inactivés sont des pseudogènes non traités. [24] Les transpositions de gènes mitochondriaux autrefois fonctionnels du cytoplasme au noyau, également connues sous le nom de NUMT, sont également considérées comme un type de pseudogène commun. [25] Les numts se produisent dans de nombreux taxons eucaryotes.

Alors que la loi de Dollo suggère que la perte de fonction des pseudogènes est probablement permanente, les gènes silencieux peuvent en fait conserver leur fonction pendant plusieurs millions d'années et peuvent être "réactivés" en séquences codant pour les protéines [26] et un nombre substantiel de pseudogènes sont activement transcrits. [24] [27] Parce que les pseudogènes sont supposés changer sans contrainte évolutive, ils peuvent servir de modèle utile du type et des fréquences de diverses mutations génétiques spontanées. [28]

Séquences répétées, transposons et éléments viraux Modifier

Les transposons et rétrotransposons sont des éléments génétiques mobiles. Les séquences répétées de rétrotransposons, qui comprennent des éléments nucléaires longs intercalés (LINE) et des éléments nucléaires intercalés courts (SINE), représentent une grande partie des séquences génomiques de nombreuses espèces. Les séquences Alu, classées comme un élément nucléaire court intercalé, sont les éléments mobiles les plus abondants dans le génome humain. Certains exemples ont été trouvés de SINE exerçant un contrôle transcriptionnel de certains gènes codant pour des protéines. [29] [30] [31]

Les séquences de rétrovirus endogènes sont le produit de la transcription inverse de génomes de rétrovirus dans les génomes de cellules germinales. Une mutation au sein de ces séquences rétro-transcrites peut inactiver le génome viral. [32]

Plus de 8 % du génome humain est constitué de séquences de rétrovirus endogènes (principalement décomposées), dans le cadre de la fraction de plus de 42 % qui est visiblement dérivée de rétrotransposons, tandis qu'un autre 3 % peut être identifié comme étant les restes de transposons d'ADN. Une grande partie de la moitié restante du génome qui est actuellement sans origine expliquée devrait avoir trouvé son origine dans des éléments transposables qui étaient actifs il y a si longtemps (> 200 millions d'années) que des mutations aléatoires les ont rendus méconnaissables. [33] La variation de la taille du génome dans au moins deux types de plantes est principalement le résultat de séquences de rétrotransposons. [34] [35]

Télomères Modifier

Les télomères sont des régions d'ADN répétitif à l'extrémité d'un chromosome, qui offrent une protection contre la détérioration chromosomique pendant la réplication de l'ADN. Des études récentes ont montré que les télomères fonctionnent pour aider à sa propre stabilité. Les ARN contenant des répétitions télomériques (TERRA) sont des transcrits dérivés des télomères. Il a été démontré que TERRA maintient l'activité de la télomérase et allonge les extrémités des chromosomes. [36]

Le terme « ADN indésirable » est devenu populaire dans les années 1960. [37] [38] Selon T. Ryan Gregory, la nature de l'ADN indésirable a été discutée pour la première fois explicitement en 1972 par un biologiste génomique, David Comings, qui a appliqué le terme à tout l'ADN non codant. [39] Le terme a été formalisé la même année par Susumu Ohno, [19] qui a noté que la charge mutationnelle des mutations délétères plaçait une limite supérieure au nombre de loci fonctionnels auxquels on pouvait s'attendre étant donné un taux de mutation typique. Ohno a émis l'hypothèse que les génomes de mammifères ne pourraient pas avoir plus de 30 000 loci sous sélection avant que le « coût » de la charge mutationnelle ne provoque un déclin inéluctable de la valeur adaptative et, éventuellement, l'extinction. Cette prédiction reste robuste, le génome humain contenant environ 20 000 gènes (codant les protéines). Une autre source de la théorie d'Ohno était l'observation que même des espèces étroitement apparentées peuvent avoir des tailles de génome largement (ordres de grandeur) différentes, ce qui avait été surnommé le paradoxe de la valeur C en 1971. [6]

Le terme « ADN indésirable » a été remis en cause au motif qu'il provoque une forte a priori l'hypothèse d'une non-fonctionnalité totale et certains ont recommandé d'utiliser à la place une terminologie plus neutre telle que « ADN non codant ». [39] Pourtant, "l'ADN indésirable" reste une étiquette pour les portions d'une séquence génomique pour lesquelles aucune fonction discernable n'a été identifiée et qui, grâce à une analyse génomique comparative, n'apparaissent sous aucune contrainte fonctionnelle suggérant que la séquence elle-même n'a fourni aucun avantage adaptatif.

Depuis la fin des années 70, il est devenu évident que la majorité de l'ADN non codant dans les grands génomes trouve son origine dans l'amplification égoïste d'éléments transposables, dont W. Ford Doolittle et Carmen Sapienza en 1980 ont écrit dans le journal La nature: "Quand un ADN donné, ou une classe d'ADN, de fonction phénotypique non prouvée peut être montré pour avoir développé une stratégie (telle que la transposition) qui assure sa survie génomique, alors aucune autre explication de son existence n'est nécessaire." [40] On peut s'attendre à ce que la quantité d'ADN indésirable dépende du taux d'amplification de ces éléments et du taux auquel l'ADN non fonctionnel est perdu. [41] Dans le même numéro de La nature, Leslie Orgel et Francis Crick ont ​​écrit que l'ADN indésirable a « peu de spécificité et confère peu ou pas d'avantage sélectif à l'organisme ». [42] Le terme apparaît principalement dans la science populaire et de manière familière dans les publications scientifiques, et il a été suggéré que ses connotations pourraient avoir retardé l'intérêt pour les fonctions biologiques de l'ADN non codant. [43]

Certaines preuves indiquent que certaines séquences "d'ADN poubelle" sont des sources d'activité fonctionnelle (future) dans l'évolution par exaptation d'ADN à l'origine égoïste ou non fonctionnel. [44]

Projet ENCODE Modifier

En 2012, le projet ENCODE, un programme de recherche soutenu par le National Human Genome Research Institute, a rapporté que 76% des séquences d'ADN non codantes du génome humain étaient transcrites et que près de la moitié du génome était en quelque sorte accessible aux protéines génétiques régulatrices. tels que les facteurs de transcription. [1] Cependant, la suggestion d'ENCODE que plus de 80% du génome humain est biochimiquement fonctionnel a été critiquée par d'autres scientifiques, [5] qui soutiennent que ni l'accessibilité des segments du génome aux facteurs de transcription ni leur transcription ne garantit que ces segments ont une fonction biochimique et que leur transcription est sélectivement avantageuse. Après tout, des sections non fonctionnelles du génome peuvent être transcrites, étant donné que les facteurs de transcription se lient généralement à de courtes séquences qui se trouvent (au hasard) sur tout le génome. [45]

De plus, les estimations beaucoup plus faibles de la fonctionnalité avant ENCODE étaient basées sur conservation génomique estimations à travers les lignées de mammifères. [6] [7] [8] [9] La transcription et l'épissage répandus dans le génome humain ont été discutés comme un autre indicateur de la fonction génétique en plus de la conservation génomique qui peut manquer des séquences fonctionnelles mal conservées. [11] En outre, une grande partie de l'ADN indésirable apparent est impliquée dans la régulation épigénétique et semble être nécessaire pour le développement d'organismes complexes. [4] [13] [14] Approches génétiques peut manquer des éléments fonctionnels qui ne se manifestent pas physiquement sur l'organisme, approches évolutives ont des difficultés à utiliser des alignements de séquences multispécifiques précis car les génomes d'espèces même étroitement apparentées varient considérablement, et avec approches biochimiques, bien qu'ayant une reproductibilité élevée, les signatures biochimiques ne signifient pas toujours automatiquement une fonction. [11] Kellis et al. ont noté que 70 % de la couverture de transcription était inférieure à 1 transcrit par cellule (et peut donc être basée sur une transcription de fond parasite). D'un autre côté, ils ont fait valoir qu'une fraction de 12 à 15 % de l'ADN humain peut être soumise à une contrainte fonctionnelle et peut encore être une sous-estimation lorsque des contraintes spécifiques à la lignée sont incluses. En fin de compte, les approches génétiques, évolutives et biochimiques peuvent toutes être utilisées de manière complémentaire pour identifier des régions pouvant être fonctionnelles dans la biologie humaine et les maladies. [11] Certains critiques ont soutenu que la fonctionnalité ne peut être évaluée qu'en référence à une hypothèse nulle appropriée. Dans ce cas, l'hypothèse nulle serait que ces parties du génome ne sont pas fonctionnelles et ont des propriétés, que ce soit sur la base de la conservation ou de l'activité biochimique, que l'on attendrait de telles régions sur la base de notre compréhension générale de l'évolution moléculaire et biochimie. Selon ces critiques, tant qu'il n'a pas été démontré qu'une région en question possède des caractéristiques supplémentaires, au-delà de ce qui est attendu de l'hypothèse nulle, elle devrait être provisoirement étiquetée comme non fonctionnelle. [46]

Certaines séquences d'ADN non codantes doivent avoir une fonction biologique importante. Ceci est indiqué par des études de génomique comparative qui rapportent des régions hautement conservées d'ADN non codant, parfois sur des échelles de temps de centaines de millions d'années. Cela implique que ces régions non codantes sont soumises à une forte pression évolutive et à une sélection positive. [47] Par exemple, dans les génomes des humains et des souris, qui ont divergé d'un ancêtre commun il y a 65 à 75 millions d'années, les séquences d'ADN codant pour les protéines ne représentent qu'environ 20 % de l'ADN conservé, les 80 % restants de l'ADN conservé. représentés dans les régions non codantes. [48] ​​La cartographie des liaisons identifie souvent les régions chromosomiques associées à une maladie sans preuve de variantes codantes fonctionnelles des gènes dans la région, suggérant que les variantes génétiques causant la maladie se trouvent dans l'ADN non codant. [48] ​​L'importance des mutations de l'ADN non codant dans le cancer a été explorée en avril 2013. [49]

Les polymorphismes génétiques non codants jouent un rôle dans la susceptibilité aux maladies infectieuses, telles que l'hépatite C. [50] De plus, les polymorphismes génétiques non codants contribuent à la susceptibilité au sarcome d'Ewing, un cancer des os pédiatrique agressif. [51]

Certaines séquences spécifiques d'ADN non codant peuvent être des caractéristiques essentielles à la structure des chromosomes, à la fonction centromère et à la reconnaissance des chromosomes homologues au cours de la méiose. [52]

Selon une étude comparative de plus de 300 génomes procaryotes et plus de 30 génomes eucaryotes, [53] les eucaryotes semblent nécessiter une quantité minimale d'ADN non codant. Le montant peut être prédit à l'aide d'un modèle de croissance pour les réseaux génétiques réglementaires, ce qui implique qu'il est nécessaire à des fins réglementaires. Chez l'homme, le minimum prédit est d'environ 5% du génome total.

Plus de 10 % des 32 génomes de mammifères peuvent fonctionner par la formation de structures secondaires d'ARN spécifiques. [54] L'étude a utilisé la génomique comparative pour identifier les mutations compensatoires de l'ADN qui maintiennent les appariements de bases d'ARN, une caractéristique distinctive des molécules d'ARN. Plus de 80 % des régions génomiques présentant des preuves évolutives de la conservation de la structure de l'ARN ne présentent pas une forte conservation des séquences d'ADN.

L'ADN non codant peut peut-être servir à diminuer la probabilité de perturbation des gènes lors du croisement chromosomique. [55]

Preuve des scores polygéniques et GWAS Modifier

Les études d'association à l'échelle du génome (GWAS) et l'analyse par apprentissage automatique de grands ensembles de données génomiques ont conduit à la construction de prédicteurs polygéniques pour les traits humains tels que la taille, la densité osseuse et de nombreux risques de maladie. Des prédicteurs similaires existent pour les espèces végétales et animales et sont utilisés dans la sélection agricole. [57] L'architecture génétique détaillée des prédicteurs humains a été analysée et les effets significatifs utilisés dans la prédiction sont associés à des régions d'ADN très éloignées des régions codantes. La fraction de variance prise en compte (c'est-à-dire la fraction du pouvoir prédictif capturé par le prédicteur) dans les régions codantes par rapport aux régions non codantes varie considérablement pour différents traits complexes. Par exemple, la fibrillation auriculaire et le risque de maladie coronarienne sont principalement contrôlés par des variantes dans les régions non codantes (fraction de variance non codante supérieure à 70 %), tandis que le diabète et l'hypercholestérolémie présentent le schéma inverse (variance non codante d'environ 20 à 30 % ). [56] Les différences individuelles entre les humains sont clairement affectées de manière significative par des loci génétiques non codants, ce qui est une preuve solide d'effets fonctionnels. Les génotypes de l'exome entier (c'est-à-dire qui contiennent des informations limitées aux régions codantes uniquement) ne contiennent pas suffisamment d'informations pour construire ou même évaluer des prédicteurs polygéniques pour de nombreux traits complexes et risques de maladie bien étudiés.

En 2013, il a été estimé qu'en général, jusqu'à 85% des loci GWAS ont des variantes non codantes comme association causale probable. Les variantes sont souvent courantes dans les populations et devraient affecter les risques de maladie par le biais de petits effets phénotypiques, par opposition aux effets importants des variantes mendéliennes. [58]

Certaines séquences d'ADN non codantes déterminent les niveaux d'expression de divers gènes, à la fois ceux qui sont transcrits en protéines et ceux qui sont eux-mêmes impliqués dans la régulation des gènes. [59] [60] [61]

Facteurs de transcription Modifier

Certaines séquences d'ADN non codantes déterminent où se fixent les facteurs de transcription. [59] Un facteur de transcription est une protéine qui se lie à des séquences d'ADN non codantes spécifiques, contrôlant ainsi le flux (ou transcription) d'informations génétiques de l'ADN à l'ARNm. [62] [63]

Opérateurs Modifier

Un opérateur est un segment d'ADN auquel se lie un répresseur. Un répresseur est une protéine de liaison à l'ADN qui régule l'expression d'un ou plusieurs gènes en se liant à l'opérateur et en bloquant la fixation de l'ARN polymérase au promoteur, empêchant ainsi la transcription des gènes. Ce blocage de l'expression est appelé refoulement. [64]

Améliorateurs Modifier

Un amplificateur est une courte région d'ADN qui peut être liée à des protéines (facteurs agissant en trans), un peu comme un ensemble de facteurs de transcription, pour améliorer les niveaux de transcription des gènes dans un groupe de gènes. [65]

Silencieux Modifier

Un silencieux est une région de l'ADN qui inactive l'expression des gènes lorsqu'elle est liée à une protéine régulatrice. Il fonctionne de manière très similaire en tant qu'amplificateurs, ne différant que par l'inactivation des gènes. [66]

Promoteurs Modifier

Un promoteur est une région de l'ADN qui facilite la transcription d'un gène particulier lorsqu'un facteur de transcription s'y lie. Les promoteurs sont généralement situés à proximité des gènes qu'ils régulent et en amont de ceux-ci. [67]

Isolateurs Modifier

Un isolant génétique est un élément limite qui joue deux rôles distincts dans l'expression des gènes, soit en tant que code bloquant l'amplificateur, soit rarement en tant que barrière contre la chromatine condensée. Un isolant dans une séquence d'ADN est comparable à un séparateur de mots linguistiques tel qu'une virgule dans une phrase, car l'isolant indique où se termine une séquence améliorée ou réprimée. [68]

Évolution Modifier

Des séquences partagées d'ADN apparemment non fonctionnel sont une preuve majeure de descendance commune. [69]

Les séquences pseudogènes semblent accumuler les mutations plus rapidement que les séquences codantes en raison d'une perte de pression sélective. [28] This allows for the creation of mutant alleles that incorporate new functions that may be favored by natural selection thus, pseudogenes can serve as raw material for evolution and can be considered "protogenes". [70]

A study published in 2019 shows that new genes (termed de novo gene birth) can be fashioned from non-coding regions. [71] Some studies suggest at least one-tenth of genes could be made in this way. [71]

Long range correlations Edit

A statistical distinction between coding and non-coding DNA sequences has been found. It has been observed that nucleotides in non-coding DNA sequences display long range power law correlations while coding sequences do not. [72] [73] [74]

Forensic anthropology Edit

Police sometimes gather DNA as evidence for purposes of forensic identification. As described in Maryland v. King, a 2013 U.S. Supreme Court decision: [75]

The current standard for forensic DNA testing relies on an analysis of the chromosomes located within the nucleus of all human cells. 'The DNA material in chromosomes is composed of "coding" and "non-coding" regions. The coding regions are known as genes and contain the information necessary for a cell to make proteins. . . . Non-protein coding regions . . . are not related directly to making proteins, [and] have been referred to as "junk" DNA.' The adjective "junk" may mislead the lay person, for in fact this is the DNA region used with near certainty to identify a person. [75]


More Clues that Intergenic DNA Is Functional

You&rsquore an enzyme of RNA polymerase floating in the nucleus of a cell. Your job is to transcribe a gene, but you are blind and it&rsquos dark. Other machines guide you to a promoter, where your work begins, but how do you know which direction to read?

Two recent papers add more insight to the wondrous design of DNA transcription. Both papers recognize that protein-coding genes represent only a tiny part, about 3%, of the DNA in a cell. The looming question that the ENCODE project began to answer last year is, how much of that intergenic DNA is functional? Since most of it is transcribed (a process that requires the expenditure of energy), the cell presumably performs all that work for a reason.

The first paper, published in La nature, examined how RNA polymerase (RNAP) knows which way to begin transcription. Gene starts are designated by &ldquopromoter&rdquo regions, but from that point, RNAP can read either direction on either fork, once the double helix is unwound. The authors found that two DNA segments, working against each other, regulate the reading of genes and non-genes.

One, named PAS, controls whether a polyadenylation tail (a series of adenines, or &ldquoA&rdquo letters in the code), is added to the growing messenger RNA (mRNA). For genes, that tail prepares the mRNA for export from the nucleus. For intergenic transcripts, though, polyadenylation signals other enzymes to cleave it into small transcripts.

The other sequence, named U1 snRNP, controls whether the mRNA is cleaved after transcription by suppressing polyadenylation. When present, it allows RNAP to proceed uninterrupted.

Gene regions are rich in U1 snRNP but low in PAS. The reverse is true for intergenic regions. The authors believe this is how RNAP avoids excessive transcribing of non-coding DNA. The shortened, cleaved transcripts, like lincRNAs, stay in the nucleus to perform other functions. A report from MIT explains how these sequences offset each other:

The work demonstrates the important role of U1 snRNP in protecting mRNA as it is transcribed from genes and in preventing the cell from unnecessary copying of non-protein-coding DNA, says Gideon Dreyfuss, a professor of biochemistry and biophysics at the University of Pennsylvania School of Medicine.

&ldquoThey&rsquove identified a very likely mechanism for early termination of these upstream RNAs by depriving them of U1 snRNP suppression of polyadenylation and cleavage,&rdquo says Dreyfuss, who was not part of the research team.

The authors of the La nature paper, though, remained undecided about the roles of these upstream, intergenic transcripts:

Les fonction of all of this upstream noncoding RNA is still a subject of much investigation. &ldquoThat transcriptional process could produce an RNA that has some function, or it could be a product of the nature of the biochemical reaction. This will be debated for a long time,&rdquo Sharp says.

His lab is now exploring the relationship between this transcription process and the observation of large numbers of so-called long noncoding RNAs (lncRNAs). He plans to investigate the mechanisms that control the synthesis of such RNAs and try to determine their functions. (Emphasis added.)

In their paper, the authors toss in a Darwinian speculation. They proposed that upstream antisense RNAs (uaRNA), or RNAs transcribed in the &ldquowrong&rdquo direction, might represent ancestors of protein-coding genes, and that lncRNAs are intermediate forms that gained or lost U1 snRNP and polyadenylation sequences. They found some differences in U1 snRNP counts between orthologous regions in human and mouse genomes as support for the idea.

This hypothesis, though, seems absurd for several reasons. For one, how or why would a non-functional transcript acquire a function? Before it had a function, why would it be transcribed and conserved? Natural selection cannot act to &ldquostore up&rdquo variations in hopes of finding a future function. Functional protein sequences, as William Dembski and Robert Marks have shown, represent a tiny fraction of sequence space. Imagining that a blind, unguided process would find one of them seems optimistic to the point of being ridiculous. The authors did not pursue their wishful thinking in detail, but rather dropped the subject after a brief mention, focusing primarily on the &ldquoU1-PAS axis&rdquo as having &ldquowide use as a general mechanism à regulate transcription elongation in mammals.&rdquo Regulation par un mechanism is the language of design.

A second paper, in Génétique PLoS, is more confident that the intergenic transcripts are functional. Confirming what ENCODE found last year (that at least 85% of intergenic regions are transcribed and regulated), these authors believe functions are soon to be discovered in the forest of intergenic DNA. The Abstract says:

Known protein coding gene exons compose less than 3% of the human genome. Les remaining 97% is largely uncharted territory, with only a small fraction characterized. The recent observation of transcription in this intergenic territory has stimulated debate about the extent of intergenic transcription and whether these intergenic RNAs are functional. Ici, nous directly observed with a large set of RNA-seq data covering a wide array of human tissue types that the majority of the genome is indeed transcribed, corroborating recent observations by the ENCODE project. Furthermore, using de novo transcriptome assembly of this RNA-seq data, we found that intergenic regions encode far more long intergenic noncoding RNAs (lincRNAs) than previously described, helping to resolve the discrepancy between the vast amount of observed intergenic transcription and the limited number of previously known lincRNAs. In total, we identified tens of thousands of putative lincRNAs expressed at a minimum of one copy per cell, significantly expanding upon prior lincRNA annotation sets. These lincRNAs are specifically regulated and conserved rather than being the product of transcriptional noise. In addition, lincRNAs are strongly enriched for trait-associated SNPs suggesting a new mechanism by which intergenic trait-associated regions may function. These findings will enable the discovery and interrogation of novel intergenic functional elements.

The clear implication is that lincRNAs are functional, else why would the cell regulate them and ensure their conservation? The authors&rsquo optimism continues in their Introduction:

A large fraction of the human genome consists of intergenic sequence. Once referred to as &ldquojunk DNA&rdquo, it is now clear that functional elements exist in intergenic regions. In fact, genome wide association studies have revealed that approximately half of all disease and trait-associated genomic regions are intergenic. While some of these regions may fonction solely as DNA elements, it is now known that intergenic regions can be transcribed, et un growing list of functional noncoding RNA genes within intergenic regions has emerged.

What do we know about lincRNA functions at this time?

Long intergenic noncoding RNAs (lincRNAs) are defined as intergenic (relative to current gene annotations) transcripts longer than 200 nucleotides in length that lack protein coding capacity. LincRNAs are known to perform myriad functions through diverse mechanisms ranging from the regulation of epigenetic modifications and gene expression to acting as scaffolds pour protein signaling complexes.

Since these authors found significantly more lincRNAs in their survey than previously known, the implication is that more of those &ldquomyriad functions&rdquo are waiting to be found. (For more functions already discovered, see the lncRNA blog.) Here&rsquos their concluding statement:

Owing to the extended breadth of tissues sampled and relaxed constraints on transcript structure, we find significantly more lincRNAs than all previous lincRNA annotation sets combined. Our analyses revealed that these lincRNAs display many features consistent with functionality, contrasting prior claims that intergenic transcription is primarily the product of transcriptional noise. In sum, our findings corroborate recent reports of pervasive transcription across the human genome and demonstrate that intergenic transcription results in the production of a large number of previously unknown lincRNAs. We provide this vastly expanded lincRNA annotation set as an important resource for the study of intergenic functional elements in human health and disease.

It&rsquos clear that the search for function is driving this cutting-edge research. Search for function is exactly what intelligent-design science would recommend. Darwinians describe natural selection as a tinkerer, generating useless parts as well as structures cobbled together that might do something by chance, since there is no supervising designer to guide the process in a particular way. By contrast, intelligent design expects that what exists, as the product of mind, is there for a reason.

Remember how Darwinists call ID a &ldquoscience stopper,&rdquo since it supposedly counsels just giving up and saying, &ldquoGod did it&rdquo? The real science stopper is Darwinism. It focused only on protein-coding genes and dismissed everything else as &ldquotranscriptional noise&rdquo or &ldquojunk DNA&rdquo left behind by the blind tinkerer. Why waste time studying junk? Were it not for that attitude, our understanding of intergenic DNA function might have been much farther along by now.


Résumé

Long intergenic non-coding RNA (lincRNA) genes have diverse features that distinguish them from mRNA-encoding genes and exercise functions such as remodelling chromatin and genome architecture, RNA stabilization and transcription regulation, including enhancer-associated activity. Some genes currently annotated as encoding lincRNAs include small open reading frames (smORFs) and encode functional peptides and thus may be more properly classified as coding RNAs. lincRNAs may broadly serve to fine-tune the expression of neighbouring genes with remarkable tissue specificity through a diversity of mechanisms, highlighting our rapidly evolving understanding of the non-coding genome.


Which are found in non coding sections of DNA?

Non-coding DNA sequences are Composants of an organism's ADN that do not encode protein sequences. Certains non-coding DNA is transcribed into functional non-codage RNA molecules (e.g. transfer RNA, ribosomal RNA, and regulatory RNAs).

One may also ask, what are the coding regions of DNA called? Coding DNA sequences are separated by long regions of DNA called introns that have no apparent function. Coding DNA est aussi connu comme an exon.

Likewise, people ask, why do you have non coding areas of DNA?

Some introns pouvez regulate transfer RNA and ribosomal RNA activity and protéine-coding gene expression. A very important non-codage séquence de DNA is called a telomere, which est une Région of repetitive ADN at the end of a chromosome and protects coding DNA from being lost during cell division.


Genomic Variation between Organisms

The amount of total genomic DNA varies widely between organisms, and the proportion of coding and noncoding DNA within these genomes varies greatly as well. More than 98% of the human genome does not encode protein sequences, including most sequences within introns and most intergenic DNA. While overall genome size, and by extension the amount of noncoding DNA, are correlated to organism complexity, there are many exceptions. For example, the genome of the unicellular Polychaos dubium (formerly known as Amoeba dubia) has been reported to contain more than 200 times the amount of DNA in humans. The pufferfish Takifugu rubripes genome is only about one eighth the size of the human genome, yet seems to have a comparable number of genes approximately 90% of the Takifugu genome is noncoding DNA.

In 2013, a new &ldquorecord&rdquo for most efficient genome was discovered. Utricularia gibba, a bladderwort plant, has only 3% noncoding DNA. The extensive variation in nuclear genome size among eukaryotic species is known as the C-value enigma or C-value paradox. Most of the genome size difference appears to lie in the noncoding DNA. About 80 percent of the nucleotide bases in the human genome may be transcribed, but transcription does not necessarily imply function.

Figure (PageIndex<1>) : Utricularia gibba flower: Utricularia gibba has 3% noncoding DNA, which is low for flowering plants. This 3% has given this plant the title the &lsquomost efficient&rsquo genome.


Voir la vidéo: This recipe from grandma stunned everyone! Simple hearty dinner! (Août 2022).