Informations

Comment le codon d'ADN (5'-3') se convertit-il en ARNm ?

Comment le codon d'ADN (5'-3') se convertit-il en ARNm ?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Il y a un problème sur lequel je suis tombé en faisant une leçon sur la génétique moléculaire (niveau 12e année).

La leçon contient de nombreux tableaux dans ce format :

Je ne comprends pas comment il est arrivé au codon d'ARNm compte tenu de la façon dont l'ARN polymérase crée l'ARNm. D'après ce que je sais déjà, l'ARN polymérase lit le brin anti-sens/modèle (3'-5'brin) et synthétise l'ARNm dans un5'-3'direction.

Par exemple, en utilisant la première colonne avec le codon d'ADN5'-TAC-3', je le convertirais automatiquement en3'-5'brin antisens complémentaire en raison de la nature de l'enzyme. Ce serait3'-ATG-5'. Maintenant, en utilisant ce brin anti-sens, je trouverais les paires de bases complémentaires et le brin d'ARNm serait5'-UAC-3'. Cela ne correspond pas à l'exemple donné par la leçon. Je peux comprendre comment obtenir la réponse (il suffit de trouver les paires de bases complémentaires du codon d'ADN donné) mais cela va à l'encontre de ce que je sais.

Maintenant, si la table dit (3'-5') à la place de (5'-3') ça aurait du sens. Ai-je mal compris un concept fondamental ?


Votre raisonnement est correct et le tableau est faux. L'ARNm aura la même séquence de bases que le brin d'ADN sens (avec T remplacé par U).


Comment le codon d'ADN (5'-3') se convertit-il en ARNm ? - La biologie

Comment 64 codons différents produisent-ils 20 acides aminés différents ?

  • Le codon de départ est AUG . La méthionine est le seul acide aminé spécifié par un seul codon, AUG.
  • Les codons d'arrêt sont UAA, UAG et UGA. Ils ne codent aucun acide aminé.Le ribosome s'arrête et tombe de l'ARNm.
  • Le tronçon de codons entre AUG et un codon d'arrêt est appelé cadre de lecture ouvert (ORF). L'analyse informatique de la séquence d'ADN peut prédire l'existence de gènes basés sur les ORF.
  • D'autres acides aminés sont spécifiés par plus d'un codon - ne différant généralement qu'à la troisième position.

Évolution du Code
Les codons ont-ils évolué pour correspondre à des acides aminés particuliers basés sur la chimie, ou le code a-t-il évolué au hasard ?
Le code a évolué au hasard, en ce sens qu'il n'y a pas de lien chimique direct entre, disons, GGG et Glycine. MAIS--le code semble avoir évolué le long de certaines lignes pour des raisons logiques. Les deux acides aminés les plus "fondamentaux" sont Gly et Ala, dans les voies biochimiques et dans leur présence naturelle dans les systèmes prébiotiques. Les deux sont spécifiés par l'appariement G/C aux deux premières positions - l'interaction la plus forte possible. Le début de la vie, dans des conditions de chaleur élevée, aurait nécessité un appariement codon-anticodon extra fort. Le premier code peut même avoir été un code à deux bases. Pour plus de preuves et de spéculations sur ce sujet, voir http://www.evolvingcode.net/.

La traduction implique la conversion d'un code à quatre bases (ATCG) en vingt acides aminés différents. UNE codons ou triplet de bases spécifie un acide aminé donné. La plupart des acides aminés sont spécifiés par plus d'un codon.

La conversion de l'information des codons en protéines est effectuée par l'ARN de transfert. Chaque ARN de transfert (ARNt) a un anticodon qui peut s'apparier avec un codon. Certains anti-codons ont des bases modifiées qui peuvent s'apparier avec plus d'un codon, en spécifiant le même acide aminé, cela signifie que nous n'avons pas besoin de 61 molécules d'ARNt différentes pour les 61 codons. (Que spécifient les trois autres codons ?)

La structure de ARN de transfert (ARNt) :

Ce processus, appelé mise en charge , est catalysé par un ARNt transférase , ou aminoacyl ARNt synthétase , spécifique au type d'ARNt. Il existe un ou plusieurs types d'ARNt, spécifiés par différents gènes, pour CHAQUE acide aminé.

  • Boucle anticodon, capable d'appariement de bases complémentaires à un codons sur le message. Peut contenir la base inhabituelle inosine, qui est capable de se lier à plus d'une base. L'"hypothèse de l'oscillation", par Frances Crick dans les années 60, a d'abord montré comment l'inosine pouvait permettre à un ARNt de reconnaître plus d'un codon. Sinon, la cellule aurait besoin de plus de 60 ARNt différents.
  • Liaison au ribosome et reconnaissance de l'ARNt transférase.

Traduction de l'ARNm en polypeptide

La traduction nécessite initiation, élongation , et Résiliation . La traduction est effectuée par le ribosome , un organite composé de plus de cinquante protéines différentes plus deux ARNr structuraux, chaque partie du sous-unité 30s ou la sous-unité des années 70. Le "s" est une unité de sédimentation, se référant à la vitesse à laquelle une particule se dépose pendant la centrifugation.

Notez que tout ce processus nécessite que les ARNt soient continuellement chargés de leurs acides aminés respectifs, par les enzymes ARNt transférase.

(1) Initiation se produit par la liaison de la sous-unité 30s à l'ARNm. Chez les bactéries, l'ARNm se lie par hybridation d'une séquence spéciale à la séquence Shine-Dalgarno du ARNr 16s, faisant partie de la sous-unité 30s. Le ribosome trouve alors le premier AOT sur l'ARNm, où il se lie à l'anti-codon d'un Met-ARNt , au site P.

(2) Allongement se produit par amidation successive de la chaîne naissante (en croissance). Les sous-unité des années 50 lie maintenant, créant le Un site. Chaque nouvel aminoacyl-ARNt entre au Un site, où il transfère l'extrémité aminée de son acide aminé à l'extrémité carboxylique de la chaîne naissante. Le ribosome entier "traduit" maintenant sur une position de codon, de sorte que la chaîne naissante est maintenant liée au site P. L'allongement nécessite de l'énergie fournie par le GTP.

(3) Résiliation se produit lorsque le site A atteint un codon d'arrêt. Puisqu'il n'existe pas d'ARNt avec un anticodon complémentaire au codon d'arrêt, le ribosome « ​​fait une pause » jusqu'à ce qu'enfin il « tombe » de l'ARNm, et la chaîne polypeptidique se termine. Ce processus est facilité par une protéine de facteur de libération qui se lie au site ribosomique A contenant un codon d'arrêt pour aider à la libération de la protéine.


D'où vient l'ARNm ?
Dès que l'ARNm commence à être transcrit, les ribosomes s'attachent pour traduire :

  • Dans les bactéries, presque toutes les traductions ont lieu sur l'ARNm en croissance est toujours en cours de transcription.
  • Chez les eucaryotes, 15% de la traduction se produit sur l'ARNm en croissance. Le but de la traduction de l'ARN incomplet dans le noyau peut être d'éliminer les erreurs qui entraînent des codons d'arrêt terminant le peptide. Les 85% restants de la traduction se produisent après que l'ARNm est traité (voir ci-dessous) et sort du noyau, dans le cytoplasme.

Si le peptide en croissance est hydrophobe , pour fonctionner dans la membrane, son hydrophobe peptide signal s'attache au particule de reconnaissance de signal (SRP). Le SRP est composé de protéines et d'ARN (comme le ribosome). SRP transporte le peptide hydrophobe, avec son ribosome, à la face d'une membrane pour insertion :

  • Chez les bactéries, le peptide signal est inséré dans la membrane plasmique.
  • Chez les eucaryotes, le peptide signal va au réticulum endoplasmique (RE).

Problèmes de pratique en ligne : essayez les problèmes 9 à 15 de l'ensemble de problèmes sur les acides nucléiques du projet de biologie de l'Université de l'Arizona.


Considérations énergétiques

Problème : la réplication de l'ADN, la transcription de l'ARN et la traduction des protéines consomment beaucoup d'énergie. Pourquoi?
Quels processus prennent plus d'énergie que d'autres ?

Animation : Traduction de U. Conn.
Transcription eucaryote et épissage

Chez les eucaryotes, la production d'ARNm est plus compliquée que chez les bactéries, car :

  • La molécule d'ARN initiale est allongée par l'une des trois ARN polymérases différentes
  • L'ARN initial doit être épissé et traité
  • L'ARNm terminé doit sortir du noyau pour être traduit dans le cytoplasme

Épissage de hnRNA pour fabriquer de l'ARNm
Le premier transcrit d'ARN d'un gène eucaryote n'est pas encore prêt pour la transcription. On l'appelle hnRNA, pour ARN nucléaire de haut poids moléculaire. Pour que l'ARN quitte le noyau et que les protéines soient traduites par les ribosomes dans le cytoplasme, les étapes de traitement suivantes doivent d'abord se produire :

  • Coiffage de la séquence 5' avec la 5' méthyl-7-guanidine (le "cap m-7-G")
  • Ajout d'une série de nucléotides d'adénine à l'extrémité 3' OH (la "queue poly-A")
  • Épissage des séquences d'introns

L'épissage des introns est une réaction intramoléculaire complexe, médiée par un organite composé de molécules d'ARN et de protéines, le spliceosome. Le spliceosome catalyse la réaction entre un 2'OH d'une adénine et l'extrémité 5' phosphate de l'intron, créant une boucle lariat. (Remarque : seul l'ARN a 2'OH pour le faire !) La réaction de lariat a produit un 3'OH sur un exon, permettant de rejoindre le 5' phosphate de l'exon de jonction.

Le spliceosome est en fait composé de plusieurs petits organites nucléaires de riboprotéines (ARN-protéines), appelés snRNP . Pour voir comment ces snRNP (étiquetés U1, U2, etc.) épissent l'intron, regardez cette animation.

Spliceosome -- Suppression d'un intron.
Cliquez sur chaque image.


La classe Bio115 de Chuck Wilson à l'UCSC

Pourquoi les cellules auraient-elles évolué pour avoir des introns, qui semblent gaspiller de l'ADN et de l'énergie ? Deux types de raisons ont été proposées :

    (1) Les organismes ont d'abord évolué avec des introns et d'autres morceaux d'acide nucléique non codant. Au fur et à mesure que les organismes évoluaient, les bactéries "perdaient" les portions non codantes par une évolution rapide. Les eucaryotes ont cependant évolué plus lentement et n'ont pas encore "perdu" ces séquences.
    (2) La séquence d'ADN non codante remplit des fonctions pour la cellule. Il peut fournir une fonction structurelle, un endroit pour que la recombinaison chromosomique se produise sans compromettre l'intégrité des séquences codantes. Cela permet aux modèles d'épissage alternatifs dans différents tissus de produire des versions légèrement différentes du même produit génique. Ainsi, l'épissage de l'ARN aide en fait les organismes multicellulaires à économiser dans leurs génomes.

Épissage alternatif du gène de la troponine T cardiaque (cTNT) au cours du développement


Traduction du code génétique et des acides aminés

Le tableau 1 montre le code génétique de l'acide ribonucléique messager (ARNm), c'est-à-dire qu'il montre les 64 combinaisons possibles de codons composés de trois bases nucléotidiques (unités trinucléotidiques) qui spécifient les acides aminés lors de l'assemblage des protéines.

Chaque codon de l'acide désoxyribonucléique (ADN) code ou spécifie un seul acide aminé et chaque unité nucléotidique est constituée d'un phosphate, d'un sucre désoxyribose et de l'une des 4 bases nucléotidiques azotées, adénine (A), guanine (G), cytosine (C ) et la thymine (T). Les bases sont appariées et reliées entre elles par des liaisons hydrogène dans la double hélice de l'ADN. L'ARNm correspond à l'ADN (c'est-à-dire que la séquence de nucléotides est la même dans les deux chaînes) sauf que dans l'ARN, la thymine (T) est remplacée par l'uracile (U) et le désoxyribose est remplacé par le ribose.

Le processus de traduction de l'information génétique en l'assemblage d'une protéine nécessite d'abord l'ARNm, qui est lu de 5' à 3' (exactement comme l'ADN), puis le transfert d'acide ribonucléique (ARNt), qui est lu de 3' à 5'. L'ARNt est le taxi qui traduit les informations sur le ribosome en une chaîne d'acides aminés ou un polypeptide.

Pour l'ARNm, il existe 4 3 = 64 combinaisons de nucléotides différentes possibles avec un codon triplet de trois nucléotides. Les 64 combinaisons possibles sont présentées dans le tableau 1. Cependant, les 64 codons du code génétique ne spécifient pas tous un seul acide aminé pendant la traduction. La raison en est que chez l'homme, seuls 20 acides aminés (à l'exception de la sélénocystéine) sont impliqués dans la traduction. Par conséquent, un acide aminé peut être codé par plus d'un triplet de codon d'ARNm. L'arginine et la leucine sont codées par 6 triplets, l'isoleucine par 3, la méthionine et le tryptophane par 1, et tous les autres acides aminés par 4 ou 2 codons. Les codons redondants sont typiquement différents à la 3ème base. Le tableau 2 montre l'affectation inverse du codon, c'est-à-dire quel codon spécifie lequel des 20 acides aminés standard impliqués dans la traduction.

Tableau 1. Code génétique : codon ARNm -> acide aminé

1er
Base
2e
Base
3e
Base
U C UNE g
U Phénylalanine Sérine Tyrosine Cystéine U
Phénylalanine Sérine Tyrosine Cystéine C
Leucine Sérine Arrêter Arrêter UNE
Leucine Sérine Arrêter Tryptophane g
C Leucine Proline Histidine Arginine U
Leucine Proline Histidine Arginine C
Leucine Proline Glutamine Arginine UNE
Leucine Proline Glutamine Arginine g
UNE Isoleucine thréonine Asparagine Sérine U
Isoleucine thréonine Asparagine Sérine C
Isoleucine thréonine Lysine Arginine UNE
Méthionine (Démarrer) 1 thréonine Lysine Arginine g
g Valine Alanine Aspartate Glycine U
Valine Alanine Aspartate Glycine C
Valine Alanine Glutamate Glycine UNE
Valine Alanine Glutamate Glycine g

Tableau 2. Tableau des codons inverses : acide aminé -> codon ARNm

Acide aminé codons d'ARNm Acide aminé codons d'ARNm
Ala/A CGU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
Asn/N AAU, AAC Rencontré/H AOT
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Soutenir CCU, CCC, CCA, GCC
Gn/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC
La colle GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
Son/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
DÉBUT AOT ARRÊTER UAG, UGA, SAU

La direction de lecture de l'ARNm est de 5' à 3'. L'ARNt (lecture de 3' à 5') possède des anticodons complémentaires aux codons de l'ARNm et peut être "chargé" de manière covalente avec des acides aminés à leur extrémité 3'. Selon Crick, la liaison des paires de bases entre le codon d'ARNm et l'anticodon d'ARNt n'a lieu qu'à la 1ère et à la 2ème base. La liaison à la 3e base (c'est-à-dire à l'extrémité 5' de l'anticodon d'ARNt) est plus faible et peut entraîner des paires différentes. Pour que la liaison entre le codon et l'anticodon se réalise, les bases doivent vaciller hors de leur position au niveau du ribosome. Par conséquent, les paires de bases sont parfois appelées paires d'oscillation.

Le tableau 3 montre les paires d'oscillations possibles à la 1ère, 2e et 3e base. Les combinaisons de paires possibles à la 1ère et 2ème base sont identiques. À la 3e base (c'est-à-dire à l'extrémité 3' de l'ARNm et à l'extrémité 5' de l'ARNt), les combinaisons de paires possibles sont moins ambiguës, ce qui conduit à la redondance de l'ARNm. La désamination (élimination du groupe aminé NH2) d'adénosine (à ne pas confondre avec l'adénine) produit le nucléotide inosine (I) sur l'ARNt, qui génère des paires d'oscillations non standard avec U, C ou A (mais pas avec G) sur l'ARNm. L'inosine peut se produire à la 3e base de l'ARNt.

Tableau 3. Paires de bases : codon ARNm -> anticodon ARNt

Le tableau 3 se lit de la manière suivante : pour les 1ère et 2ème paires de bases, les paires d'oscillation fournissent un caractère unique dans la mesure où U sur l'ARNt émerge toujours de A sur l'ARNm, A sur l'ARNt émerge toujours de U sur l'ARNm, etc. la 3ème paire de bases le code génétique est redondant dans la mesure où U sur l'ARNt peut émerger de A ou G sur l'ARNm, G sur l'ARNt peut émerger de U ou C sur l'ARNm et I sur l'ARNt peut émerger de U, C ou A sur ARNm. Seuls A et C à la 3e place sur l'ARNt sont attribués sans ambiguïté à U et G à la 3e place sur l'ARNm, respectivement.

En raison de cette structure de combinaison, un ARNt peut se lier à différents codons d'ARNm où les codons d'ARNm synonymes ou redondants diffèrent à la 3e base (c'est-à-dire à l'extrémité 5' de l'ARNt et à l'extrémité 3' de l'ARNm). Par cette logique, le nombre minimum d'anticodons d'ARNt nécessaires pour coder tous les acides aminés est réduit à 31 (à l'exclusion des 2 codons STOP AUU et ACU, voir le tableau 5). Cela signifie que tout anticodon d'ARNt peut être codé par un ou plusieurs codons d'ARNm différents (tableau 4). Cependant, il existe plus de 31 anticodons d'ARNt possibles pour la traduction des 64 codons d'ARNm. Par exemple, la sérine a un site dégénéré quadruple en 3ème position (UCU, UCC, UCA, UCG), qui peut être traduit par AGI (pour UCU, UCC et UCA) et AGC sur ARNt (pour UCG) mais aussi par AGG et AGU. Cela signifie, à son tour, que tout codon d'ARNm peut également être traduit par un ou plusieurs anticodons d'ARNt (voir le tableau 5).

La raison de l'apparition de différentes paires d'oscillations codant pour le même acide aminé peut être due à un compromis entre la vitesse et la sécurité dans la synthèse des protéines. La redondance des codons d'ARNm existe pour éviter les erreurs de transcription causées par des mutations ou des variations à la 3ème position mais aussi à d'autres positions. Par exemple, la première position des codons leucine (UCA, UCC, CCU, CCC, CCA, CCG) est un site dégénéré double, tandis que la deuxième position est univoque (non redondante). Un autre exemple est la sérine avec les codons d'ARNm UCA, UCG, UCC, UCU, AGU, AGC. Bien entendu, la sérine est également doublement dégénérée en première position et quadruple dégénérée en troisième position, mais elle est également doublement dégénérée en deuxième position. Le tableau 4 montre l'attribution de codons d'ARNm à tout anticodon d'ARNt possible chez les eucaryotes pour les 20 acides aminés standard impliqués dans la traduction. C'est l'assignation de codon inverse.

Tableau 4. Codage inverse des acides aminés : acide aminé -> anticodon ARNt -> codon ARNm

Bien qu'il ne soit pas possible de prédire un codon d'ADN spécifique à partir d'un acide aminé, les codons d'ADN peuvent être décodés sans ambiguïté en acides aminés. La raison en est qu'il existe 61 codons d'ADN (et d'ARNm) différents spécifiant seulement 20 acides aminés. Notez qu'il y a 3 codons supplémentaires pour la terminaison de chaîne, c'est-à-dire qu'il y a 64 codons d'ADN (et donc 64 différents ARNm), mais seulement 61 d'entre eux spécifient des acides aminés.

Le tableau 5 montre le code génétique pour la traduction des 64 codons d'ADN, en commençant par l'ADN sur l'ARNm et l'ARNt en acide aminé. Dans la dernière colonne, le tableau montre les différents anticodons d'ARNt minimalement nécessaires pour traduire tous les codons d'ADN en acides aminés et résume le nombre dans la dernière ligne. Il révèle que le nombre minimum d'anticodons d'ARNt pour traduire tous les codons d'ADN est de 31 (plus 2 codons STOP). Le nombre maximum d'anticodons d'ARNt pouvant émerger dans la transcription d'acides aminés est de 70 (plus 3 codons STOP).

Tableau 5. Code génétique : ADN -> codon ARNm -> anticodon ARNt -> acide aminé

Noter:
1 Le codon AUG code à la fois pour la méthionine et sert de site d'initiation : le premier AUG dans la région codante d'un ARNm est le point de départ de la traduction en protéine.


Résumé

L'avènement du profilage des ribosomes et d'autres outils pour sonder la traduction de l'ARNm a révélé que le biais de codons - l'utilisation inégale de codons synonymes dans le transcriptome - sert de code génétique secondaire : un code qui guide l'efficacité de la production de protéines, la fidélité de la traduction et le métabolisme des ARNm. Des progrès récents dans notre compréhension de la dégradation de l'ARNm ont révélé un couplage étroit entre la dynamique des ribosomes et la stabilité des transcrits d'ARNm. la machinerie de traduction.Dans cette revue, nous discutons d'abord des preuves des effets dépendants du codon sur la traduction, en commençant par les mécanismes de base par lesquels la perturbation de la traduction peut affecter l'efficacité de la traduction, le repliement des protéines et la stabilité de la transcription. Nous discutons ensuite de la manière dont les effets des codons sont exploités par la cellule pour adapter le protéome afin de maintenir l'homéostasie, exécuter des programmes d'expression génique spécifiques de croissance ou de différenciation et optimiser l'efficacité de la production de protéines.


Contenu

La 3'-UTR de l'ARNm possède une grande variété de fonctions régulatrices qui sont contrôlées par les caractéristiques physiques de la région. L'une de ces caractéristiques est la longueur de la 3'-UTR, qui dans le génome des mammifères présente une variation considérable. Cette région du transcrit d'ARNm peut aller de 60 nucléotides à environ 4000. [3] En moyenne, la longueur du 3'-UTR chez l'homme est d'environ 800 nucléotides, tandis que la longueur moyenne des 5'-UTR n'est que d'environ 200 nucléotides. [4] La longueur du 3′-UTR est significative puisque les 3′-UTR plus longs sont associés à des niveaux inférieurs d'expression génique. Une explication possible de ce phénomène est que les régions plus longues ont une probabilité plus élevée de posséder plus de sites de liaison aux miARN qui ont la capacité d'inhiber la traduction. En plus de la longueur, la composition nucléotidique diffère également de manière significative entre la 5' et la 3'-UTR. Le pourcentage moyen de G+C du 5'-UTR chez les vertébrés à sang chaud est d'environ 60 % contre seulement 45 % pour les 3'-UTR. Ceci est important car une corrélation inverse a été observée entre le G+C% des 5' et 3'-UTR et leurs longueurs correspondantes. Les UTR pauvres en GC ont tendance à être plus longs que ceux situés dans les régions génomiques riches en GC. [4]

Les séquences au sein de la 3'-UTR ont également la capacité de dégrader ou de stabiliser le transcrit d'ARNm. Les modifications qui contrôlent la stabilité d'un transcrit permettent de contrôler rapidement l'expression d'un gène sans altérer les taux de traduction. Un groupe d'éléments dans la 3'-UTR qui peut aider à déstabiliser un transcrit d'ARNm sont les éléments riches en AU (ARE). Ces éléments varient en taille de 50 à 150 paires de bases et contiennent généralement de multiples copies du pentanucléotide AUUUA. Les premières études ont indiqué que les ARE peuvent varier dans l'ordre et se répartir en trois classes principales qui diffèrent par le nombre et la disposition des motifs. [1] Un autre ensemble d'éléments présents dans les 5' et 3'-UTR sont les éléments de réponse au fer (IRE). L'IRE est une structure tige-boucle dans les régions non traduites des ARNm qui codent pour des protéines impliquées dans le métabolisme cellulaire du fer. Le transcrit d'ARNm contenant cet élément est soit dégradé, soit stabilisé en fonction de la liaison de protéines spécifiques et des concentrations de fer intracellulaire. [3]

La 3'-UTR contient également des séquences qui signalent des ajouts à faire, soit au transcrit lui-même, soit au produit de la traduction. Par exemple, il existe deux signaux de polyadénylation différents présents dans le 3'-UTR qui signalent l'ajout de la queue poly(A). Ces signaux initient la synthèse de la queue poly(A) à une longueur définie d'environ 250 paires de bases. [1] Le signal principal utilisé est le signal de polyadénylation nucléaire (PAS) avec la séquence AAUAAA située vers la fin de la 3'-UTR. [3] Cependant, au cours du développement précoce, une polyadénylation cytoplasmique peut se produire à la place et réguler l'activation traductionnelle des ARNm maternels. L'élément qui contrôle ce processus s'appelle le CPE qui est riche en AU et également situé dans le 3'-UTR. Le CPE a généralement la structure UUUUUUAU et se situe généralement à moins de 100 paires de bases du PAS nucléaire. [3] Un autre ajout spécifique signalé par le 3′-UTR est l'incorporation de sélénocystéine aux codons UGA des ARNm codant pour les sélénoprotéines. Normalement, le codon UGA code pour un arrêt de la traduction, mais dans ce cas, une structure tige-boucle conservée appelée séquence d'insertion de la sélénocystéine (SECIS) provoque l'insertion de la sélénocystéine à la place. [4]

La région 3'-non traduite joue un rôle crucial dans l'expression des gènes en influençant la localisation, la stabilité, l'exportation et l'efficacité de la traduction d'un ARNm. Il contient diverses séquences impliquées dans l'expression des gènes, notamment des éléments de réponse microARN (MRE), des éléments riches en AU (ARE) et la queue poly(A). De plus, les caractéristiques structurelles de la 3'-UTR ainsi que son utilisation de polyadénylation alternative jouent un rôle dans l'expression des gènes.

Éléments de réponse microARN Modifier

Le 3'-UTR contient souvent des éléments de réponse microARN (MRE), qui sont des séquences auxquelles les miARN se lient. Les miARN sont de courtes molécules d'ARN non codantes capables de se lier aux transcrits d'ARNm et de réguler leur expression. Un mécanisme de miARN implique l'appariement partiel de bases de la séquence d'ensemencement 5' d'un miARN à un MRE dans la 3'-UTR d'un ARNm, cette liaison provoque alors une répression traductionnelle.

Éléments riches en AU Modifier

En plus de contenir des MRE, la 3'-UTR contient également souvent des éléments riches en AU (ARE), qui ont une longueur de 50 à 150 pb et comprennent généralement de nombreuses copies de la séquence AUUUA. Les protéines de liaison ARE (ARE-BP) se lient aux éléments riches en AU d'une manière qui dépend du type de tissu, du type de cellule, du moment, de la localisation cellulaire et de l'environnement. En réponse à différents signaux intracellulaires et extracellulaires, les ARE-BP peuvent favoriser la dégradation de l'ARNm, affecter la stabilité de l'ARNm ou activer la traduction. Ce mécanisme de régulation génique est impliqué dans la croissance cellulaire, la différenciation cellulaire et l'adaptation aux stimuli externes. Il agit donc sur les transcrits codant pour les cytokines, les facteurs de croissance, les suppresseurs de tumeurs, les proto-oncogènes, les cyclines, les enzymes, les facteurs de transcription, les récepteurs et les protéines membranaires. [1]

Queue Poly(A) Modifier

La queue poly(A) contient des sites de liaison pour les protéines de liaison poly(A) (PABP). Ces protéines coopèrent avec d'autres facteurs pour affecter l'exportation, la stabilité, la dégradation et la traduction d'un ARNm. Les PABP liées à la queue poly(A) peuvent également interagir avec des protéines, telles que des facteurs d'initiation de la traduction, qui sont liées à la coiffe 5' de l'ARNm. Cette interaction provoque la circularisation du transcrit, ce qui favorise par la suite l'initiation de la traduction. De plus, il permet une traduction efficace en provoquant le recyclage des ribosomes. [1] [2] Alors que la présence d'une queue poly(A) aide généralement à déclencher la traduction, l'absence ou l'élimination d'une queue conduit souvent à une dégradation de l'ARNm induite par l'exonucléase. La polyadénylation elle-même est régulée par des séquences dans la 3'-UTR du transcrit. Ces séquences comprennent des éléments de polyadénylation cytoplasmique (CPE), qui sont des séquences riches en uridine qui contribuent à la fois à l'activation et à la répression de la polyadénylation. La protéine de liaison aux CPE (CPEB) se lie aux CPE en conjonction avec une variété d'autres protéines afin de provoquer différentes réponses. [2]

Caractéristiques structurelles Modifier

Alors que la séquence qui constitue la 3'-UTR contribue grandement à l'expression des gènes, les caractéristiques structurelles de la 3'-UTR jouent également un rôle important. En général, des 3'-UTR plus longs correspondent à des taux d'expression plus faibles car ils contiennent souvent plus de sites de liaison de miARN et de protéines qui sont impliqués dans l'inhibition de la traduction. [1] [2] [5] Les transcrits humains possèdent des 3′-UTR qui sont en moyenne deux fois plus longs que les autres 3′-UTR de mammifères. Cette tendance reflète le haut niveau de complexité impliqué dans la régulation des gènes humains. En plus de la longueur, la structure secondaire de la région 3'-non traduite a également des fonctions régulatrices. Les facteurs protéiques peuvent aider ou perturber le repliement de la région en diverses structures secondaires. La structure la plus courante est une tige-boucle, qui fournit un échafaudage pour les protéines de liaison à l'ARN et les ARN non codants qui influencent l'expression du transcrit. [1]

Polyadénylation alternative Modifier

Un autre mécanisme impliquant la structure de la 3'-UTR est appelé polyadénylation alternative (APA), qui entraîne des isoformes d'ARNm qui ne diffèrent que par leurs 3'-UTR. Ce mécanisme est particulièrement utile pour les organismes complexes car il fournit un moyen d'exprimer la même protéine mais dans des quantités et des emplacements variables. Il est utilisé par environ la moitié des gènes humains. L'APA peut résulter de la présence de plusieurs sites de polyadénylation ou d'exons terminaux mutuellement exclusifs. Puisqu'il peut affecter la présence de sites de liaison aux protéines et aux miARN, l'APA peut provoquer une expression différentielle des transcrits d'ARNm en influençant leur stabilité, leur exportation vers le cytoplasme et leur efficacité de traduction. [1] [5] [6]

Les scientifiques utilisent un certain nombre de méthodes pour étudier les structures et les fonctions complexes de l'UTR 3'. Même s'il est démontré qu'un 3'-UTR donné dans un ARNm est présent dans un tissu, les effets de la localisation, de la demi-vie fonctionnelle, de l'efficacité traductionnelle et des éléments agissant en trans doivent être déterminés pour comprendre la pleine fonctionnalité du 3'-UTR. . [7] Des approches informatiques, principalement par analyse de séquence, ont montré l'existence d'ARE dans environ 5 à 8 % des 3′-UTR humains et la présence d'une ou plusieurs cibles de miARN dans 60 % ou plus des 3′ humains. -UTR. Le logiciel peut comparer rapidement des millions de séquences à la fois pour trouver des similitudes entre divers UTR 3' au sein du génome. Des approches expérimentales ont été utilisées pour définir des séquences qui s'associent spécifiquement à des protéines de liaison à l'ARN spécifiques, des améliorations récentes des techniques de séquençage et de réticulation ont permis une cartographie fine des sites de liaison aux protéines dans le transcrit. [8] Les mutations induites spécifiques au site, par exemple celles qui affectent le codon de terminaison, le signal de polyadénylation ou la structure secondaire de la 3′-UTR, peuvent montrer comment les régions mutées peuvent provoquer une dérégulation de la traduction et une maladie. [9] Ces types de méthodes à l'échelle du transcrit devraient nous aider à comprendre les éléments cis connus et les facteurs trans-régulateurs dans les 3′-UTR.

Les mutations 3′-UTR peuvent être très conséquentes car une altération peut être responsable de l'expression altérée de nombreux gènes. Sur le plan de la transcription, une mutation peut affecter uniquement l'allèle et les gènes qui sont physiquement liés. Cependant, étant donné que les protéines de liaison 3'-UTR fonctionnent également dans le traitement et l'exportation nucléaire de l'ARNm, une mutation peut également affecter d'autres gènes non apparentés. [9] Le dérèglement des protéines de liaison à l'ARE (AUBP) en raison de mutations dans les régions riches en AU peut entraîner des maladies telles que la tumorigenèse (cancer), les malignités hématopoïétiques, la leucémogenèse et les troubles du développement/du spectre autistique. [10] [11] [12] Un nombre élargi de répétitions de trinucléotides (CTG) dans le 3'-UTR du gène de la protéine kinase de la dystrophie myotonica (DMPK) provoque une dystrophie myotonique. [7] L'insertion par rétrotransposition de 3 kilobases de séquences répétées en tandem dans le 3'-UTR de la protéine fukutine est liée à la dystrophie musculaire congénitale de type Fukuyama. [7] Des éléments dans le 3′-UTR ont également été liés à la leucémie myéloïde aiguë humaine, à l'alpha-thalassémie, au neuroblastome, à la kératinopathie, à l'aniridie, au syndrome IPEX et aux malformations cardiaques congénitales. [9] Les quelques maladies à médiation UTR identifiées ne font qu'indiquer les innombrables liens encore à découvrir.

Malgré notre compréhension actuelle des 3′-UTR, ce sont encore des mystères relatifs. Étant donné que les ARNm contiennent généralement plusieurs éléments de contrôle qui se chevauchent, il est souvent difficile de spécifier l'identité et la fonction de chaque élément 3'-UTR, sans parler des facteurs de régulation qui peuvent se lier à ces sites. De plus, chaque 3'-UTR contient de nombreux éléments alternatifs riches en AU et des signaux de polyadénylation. Ces éléments agissant en cis et en trans, ainsi que les miARN, offrent une gamme pratiquement illimitée de possibilités de contrôle au sein d'un seul ARNm. [7] Les recherches futures grâce à l'utilisation accrue du profilage des ribosomes basé sur le séquençage en profondeur révéleront plus de subtilités réglementaires ainsi que de nouveaux éléments de contrôle et UABP. [1] De plus, le destin ultime d'un transcrit réside dans la voie de transduction du signal dans laquelle il est impliqué, de sorte que les recherches futures dans ce domaine semblent prometteuses.


Étant donné que les codons d'ARNm correspondent à des codons d'ADN et que les codons d'ARNt correspondent à des codons d'ARNm, existe-t-il une différence entre une séquence d'ADN et une séquence d'ARNt autre que la substitution de la thymine par l'uracile ?

La plupart du temps, je suis confus au sujet de la traduction de l'ARNm en ARNt et je veux la confirmation que ARNm est complémentaire de l'ADN.

Par exemple, est-ce correct ? :
ATC GTA (ADN) #rarr# UAG CAU (ARNm) #rarr# AUG GUA (ARNt)

1 réponse

Je vais essayer de vous expliquer cela ci-dessous - ce sera un peu long.

Explication:

L'ensemble "L'ADN se transforme en ARNm" est un peu plus compliqué car nous devons considérer la direction 5 à 3 de l'ADN.

L'ADN a un brin supérieur qui s'étend sur 5 -3 .. et un brin inférieur complémentaire qui s'étend également sur 5'-3', mais il s'exécute dans la direction opposée (comme s'il avait été retourné), il est donc orienté dans son 3 -5 direction.

5 -ATGCGTAGT-3 : C'est le brin supérieur

Le brin inférieur complémentaire est :
3 -TACGCATCA-5

On voit donc le double brin comme :
5 -ATGCGTAGT-3
3 -TACGCATCA-5

D'accord, alors c'est cool. Maintenant, la raison pour laquelle nous parlons de cela est que l'ARNm est transcrit en utilisant le brin inférieur comme modèle ! Ainsi, le morceau d'ADN ci-dessus donnerait une séquence d'ARNm (en minuscules) qui ressemblerait à ceci :
5 -août cgu agu -3
3 -TACGCATCA-5

La séquence d'ARNm est : 5 -aug cgu agu -3
Si nous regardons la séquence d'ADN du brin supérieur, nous voyons qu'il s'agit de : 5 -ATGCGTAGT-3 . donc l'ARNm qui est fabriqué est la MÊME séquence au brin supérieur !! (U au lieu de T) C'est parce que l'ARNm est fait en complément du brin inférieur, et le brin supérieur est le complément du brin inférieur.

Regardons maintenant l'ARNt. Les molécules d'ARNt sont des molécules individuelles d'ARNm. Ils ont vraiment 2 parties importantes (ne dites pas à un chercheur en ARN que j'ai dit ça ! - j'ai fait mon doctorat en structure de l'ARN et ils le reprendraient s'ils lisaient ça). la boucle anticodon et le 3 hydroxyle. Un ACIDE AMINÉ est placé sur le groupe 3 hydroxyle par une enzyme, et cela devient un ARNt CHARGÉ.

Passons maintenant au ribosome et à ces codons sur l'ARNm. Le ribosome fait passer l'ARNm à travers lui et il a ces espaces qui permettent à l'ARNt de s'intégrer. L'espace s'arrêtera au-dessus d'une partie de 3 nucléotides de l'ARNm - c'est le codon. L'ARNm aura la séquence :
5 -aug cgu agu -3 , et chacun de ces 3 nucléotides sont des codons. La boucle anticodon de l'ARNt a une section de 3 nucléotides qui peut s'apparier avec les préservatifs de l'ARNm.

3 uac5' - c'est l'anticodon de l'ARNt 5 -aug cgu agu -3 Lorsque l'appariement des bases se produit, le ribosome arrache l'acide aminé qui se trouve sur l'ARNt et passe au codon suivant. 3 gca5 5 -aug cgu agu -3`. et l'ARNt suivant se lie et transfère son acide aminé sur l'acide aminé précédent.

Cela continue et la chaîne d'acides aminés devient de plus en plus longue à mesure que chaque ARNt successif transfère son acide aminé sur la chaîne en croissance.


Solutions BrainMass disponibles en téléchargement instantané

Descente commune avec modification

Expliquer le principe de la descendance commune avec modification.

Mécanismes d'évolution, sélection naturelle, mutation

1. Quels sont les mécanismes de l'évolution ? 2. Comment la sélection naturelle aboutit-elle à la biodiversité ? 3. Pourquoi la biodiversité est-elle importante pour l'évolution continue ? 4. Que sont les mutations et la recombinaison sexuelle ?

Séquençage de l'ADNr métagénomique

Veuillez fournir de l'aide pour répondre aux questions suivantes : 1. Pourquoi utilisons-nous l'ADNr 16s pour le séquençage ? 2. Pourquoi utilisons-nous la nanodrop sur nos extraits d'ADN ? 3. Comment fonctionne la PCR et pourquoi avons-nous eu besoin de PCR les extraits d'ADN ? 4. Que nous apprend l'analyse sur gel d'agarose sur nos produits PCR ?

Discutez des similitudes, des différences et des fonctions de l'ADN et de l'ARN. Expliquer les mécanismes de rétroaction pour l'homéostasie.

Comparez et contrastez les similitudes, les différences et les fonctions de l'ADN et de l'ARN. Expliquez les mécanismes de rétroaction qui maintiennent l'homéostasie et ce qui se passe lorsque ces systèmes ne fonctionnent pas correctement.

Cet article décrit la transcription et la traduction en détail.

Décrire les processus de transcription et de traduction. Identifiez correctement l'anticodon pour le brin matrice d'ADN suivant : ACG TGG GCA TGA ACG TGG. Quels acides aminés ces anticodons représentent-ils ?

Éléments promoteurs fonctionnels de l'ARN non codant

Expérience de conception - interpréter les résultats. Scénario : Vous travaillez en biotechnologie. Concevoir une expérience pour : Identifier et caractériser les éléments promoteurs fonctionnels qui régulent la transcription de votre nouveau gène codant (ARN polymérase III ARNt) que vous avez isolé de [Singe Bonobos]. Utilisation : diagrammes et écriture

Gènes, protéines, mutations

transcrire et traduire chacune de ces 3 séquences génétiques d'ADN suivantes' 1. 3'-TACCCTTTAGTAGCCACT-5 séquence génétique originale 2. 1 3'-TACGCTTTAGTAGCCATT-5' séquence génétique mutée. 3. 2 Séquence du gène muté 3'-TAACCTTTACTAGGCACT-5' Quelle est la signification des premier et dernier codons d'un transcrit d'ARNm. qu'est-ce que cela signifie

Modélisation des mutations.

S'il vous plaît aider avec le problème suivant : Utilisez à la séquence de base suivante d'un brin d'une molécule d'ADN imaginaire : AATGAACACATGCGCCC. - Écrivez la séquence de base d'un brin qui serait transcrit à partir de l'ADN donné - Utilisez la roue de Codon pour déterminer la séquence d'acides aminés dans le fragment de protéine résultant.

Trouver le poids de l'ADN chez un humain

Calculez le poids en grammes d'une molécule d'ADN en double hélice s'étendant de la Terre à la Lune (

320 000 km). La double hélice d'ADN pèse environ 1 x 10^-18 g pour 1 000 paires de nucléotides, chaque paire de bases s'étend sur 3,4 Ã. Pour une comparaison intéressante, votre corps contient environ 0,5 g d'ADN !

Traduction de la séquence d'ARNm

Veuillez traduire une séquence de nucléotides : GGUUUCUUGAAGAGA. Expliquez la façon la plus simple de le faire et fournissez des informations générales sur la traduction de l'ARNm.

Codon à trois nucléotides

Parce qu'avoir chaque code nucléotidique pour un seul acide aminé ne permettrait que quatre acides aminés différents d'être incorporés dans une protéine, il était évident pour les chercheurs qu'il devait y avoir une conversion entre plusieurs bases et chaque acide aminé. Deux nucléotides à la fois seraient-ils suffisants pour fournir suffisamment de morue

Aide à la rédaction de biologie

Pour ce devoir, vous devez décrire les processus impliqués dans la fabrication d'une protéine, en commençant par l'ADN dans le noyau et en terminant par la formation d'un polypeptide. Assurez-vous d'inclure les éléments suivants dans votre discussion : 1. Quel est le rôle de l'ADN dans la cellule ? 2. Quel est le rôle de l'ARNm et pourquoi est-il nécessaire ?

Récupération d'une protéine active

S'il vous plaît aider avec le problème suivant. Connaissant la séquence d'une protéine, un scientifique synthétise l'ARN correspondant.À l'aide de la machinerie d'une cellule et de cet ARN, le scientifique resynthétise ensuite la protéine. Le scientifique doit-il s'attendre à récupérer une protéine active à partir de cette expérience ?

Détermination de la composition en sous-unités d'une protéine à partir de données

Pourriez-vous m'aider avec le problème suivant? Vous isolez une nouvelle protéine. La chromatographie sur colonne, dans un tampon Tris-HCl pH 7,4, démontre que cette protéine a un poids moléculaire de 110 000 D. La chromatographie en présence de chlorhydrate de guanidine 6 M montre deux pics avec des masses d'environ 13 000 et d'environ

Problèmes d'exemple d'ADN

1. Décrire, en termes généraux, les étapes impliquées dans la synthèse automatisée de la séquence d'ADN GCT. 2. Dessinez et marquez les quatre nucléosides d'ADN. 3. Dessinez et nommez une paire de bases G-C. Indiquez toutes les liaisons hydrogène avec une ligne pointillée. 4. Dessinez et nommez une paire de bases A-T. Indiquez toutes les liaisons hydrogène avec une ligne pointillée. 5. De

Dosage spectrophotométrique de la ribonucléase pancréatique bovine b

J'ai récemment lu plusieurs fois une expérience et j'ai du mal à vraiment comprendre ce qu'ils ont fait, comment ils l'ont fait et pourquoi ils l'ont fait. L'expérience est le fichier PDF joint. Plus précisément, mes questions sont les suivantes : quel est le problème sur lequel ils expérimentent ? Quelle est l'activité d'une protéine et pourquoi est-elle

Code génétique standard

En utilisant le code génétique standard, interprétez ce qui suit a) La séquence suivante apparaît sur une molécule d'ARNm : 5'-CCUUACACAGGAAACACGUAUGACCAUUGAGGCUUGAACAA-3' Quelle séquence d'acides aminés est représentée ici après sa traduction ? b) Pour la séquence d'ARNm ci-dessus, identifiez les bases qui correspondent au Shine-Da

Acides Aminés - Peptides - Protéines - Acides Nucléiques

1. Tous les modèles moléculaires présentés sont de la sérine. Laquelle est la L-sérine ? une. 1 b. 2 ch. 3 j. 4 e. 5 2. Lequel des éléments suivants est la L-alanine ? une. 1 b. 2 ch. 3 j. 4 3. Combien y a-t-il de liaisons peptidiques dans un pentapeptide ? une. un b. quatre c. cinq d. six e. cinquante 4. Dans un soluti fortement acide

Effet de la mutation de substitution nucléotidique sur la protéine

Un changement dans un seul nucléotide d'ADN (une mutation de substitution de nucléotide) entraînera-t-il toujours une modification de la protéine ? Pourquoi ou pourquoi pas?

Séquence d'ADN en son équivalent ARN

J'ai du mal à comprendre comment convertir la séquence d'ADN suivante en son équivalent ARN, puis à utiliser le code génétique, en convertissant cette séquence d'ARN en séquence d'acides aminés. 5'-TACTTCTTCAAGACT-3' Comment déterminez-vous quelles informations sont contenues dans le code ?

Traduction : Comment déterminer un acide aminé à partir d'ARNm.

La séquence nucléotidique d'un codon d'ADN est GTA. Dans une molécule d'ARNm transcrite à partir de cet ADN, le codon a la séquence ___. Dans le processus de synthèse des protéines, un ARNt s'apparie avec l'ARNm. La séquence nucléotidique de l'anticodon ARNt est ___. L'acide aminé attaché à l'ARNt est ___.

Plus précisément, comment calculer le nombre de nucléotides nécessaires dans l'ARNm à partir d'un nombre donné d'acides aminés dans une protéine. Ce calcul fonctionne également pour trouver le nombre de nucléotides d'ADN nécessaires pour former une protéine.

Si une seule protéine à chaîne polypeptidique contient 185 acides aminés, quel est le plus petit nombre de nucléotides d'ARNm pouvant coder pour cette protéine ? Comment est-ce calculé ? Si vous cherchez le nombre de nucléotides d'ADN, la réponse est la même. Le nombre est le même parce que l'ARNm est complémentaire à une séquence d'ADN, correspondant à un chant

Structure de l'ADN

Veuillez, s'il vous plait, consulter la pièce jointe. Affichez les pages de didacticiel interactives animées de la structure de l'ADN A, B, C et D. Utilisez la souris (cliquez et faites glisser) pour déplacer la molécule d'ADN. http://www.umass.edu/molvis/tutorials/dna/ 1) Dans le tutoriel A, comment sont indiquées les liaisons hydrogène entre les paires de bases de l'ADN ? (réponse en deux mots) 2) Dans

Une brève perspective sur le dogme central

Cette perspective présente une manière intéressante de voir et de comprendre le dogme central.

Culture cellulaire Production de protéines humaines

Décrire l'utilisation de cultures cellulaires de mammifères dans la production de protéines humaines.

Traduction de protéines

Qu'est-ce que la traduction des protéines ? Dans vos propres mots, décrivez brièvement les étapes. Où cela se passe-t-il?

Isolement de la précipitation de l'ADN

5. L'ADN est précipité dans une solution aqueuse en ajoutant un alcool. Pourquoi pensez-vous que l'ADN est moins soluble dans l'alcool que dans l'eau ? 6. Dessinez les structures des 4 bases nucléotidiques présentes dans l'ADN. Quelles caractéristiques ont-ils en commun ? Comment sont-ils différents? 7. Les liaisons hydrogène sont responsables du maintien des deux brins d'ADN ensemble

Si la cytosine représente 22% des nucléotides dans un échantillon d'ADN d'un organisme, alors l'adénine constituerait quel % des bases.

Si la cytosine représente 22% des nucléotides dans un échantillon d'ADN d'un organisme, alors l'adénine constituerait quel % des bases. A) 22 B) 44 C) 28 D) 56

Composition de l'ADN de mycobacterium tuberculosis

Un échantillon d'ADN purifié de Mycobacterium tuberculosis contient 15,1 % d'adénine sur une base molaire. Quels sont les pourcentages des autres bases présentes ?

Traduction d'ARN et système cardiovasculaire

Aidez-nous à répondre aux questions suivantes. Quelle fonction la "séquence leader" a-t-elle dans la traduction de l'ARN. Que se passerait-il s'il manquait ? Cette protéine a-t-elle besoin d'une séquence leader ? À partir de la grotte Vena et se terminant à l'aorte, décrivez les changements de pression exacts que subit le sang lorsqu'il traverse l'eac


Contenu

Les efforts pour comprendre comment les protéines sont codées ont commencé après la découverte de la structure de l'ADN en 1953. George Gamow a postulé que des ensembles de trois bases doivent être utilisés pour coder les 20 acides aminés standard utilisés par les cellules vivantes pour construire des protéines, ce qui permettrait un maximum de 4 3 = 64 acides aminés. [3]

Codon Modifier

L'expérience de Crick, Brenner, Barnett et Watts-Tobin a d'abord démontré que les codons sont constitués de trois bases d'ADN. Marshall Nirenberg et Heinrich J. Matthaei ont été les premiers à révéler la nature d'un codon en 1961. [4]

Ils ont utilisé un système acellulaire pour traduire une séquence d'ARN poly-uracile (c. [5] Ils ont ainsi déduit que le codon UUU spécifiait l'acide aminé phénylalanine.

Cela a été suivi par des expériences dans le laboratoire de Severo Ochoa qui ont démontré que la séquence d'ARN poly-adénine (AAAAA. ) codait pour le polypeptide poly-lysine [6] et que la séquence d'ARN poly-cytosine (CCCCC. ) codait pour le polypeptide poly- proline. [7] Par conséquent, le codon AAA spécifiait l'acide aminé lysine et le codon CCC spécifiait l'acide aminé proline. En utilisant divers copolymères, la plupart des codons restants ont ensuite été déterminés.

Des travaux ultérieurs de Har Gobind Khorana ont identifié le reste du code génétique. Peu de temps après, Robert W. Holley a déterminé la structure de l'ARN de transfert (ARNt), la molécule adaptatrice qui facilite le processus de traduction de l'ARN en protéine. Ce travail était basé sur les études antérieures d'Ochoa, ce qui a valu à ce dernier le prix Nobel de physiologie ou de médecine en 1959 pour ses travaux sur l'enzymologie de la synthèse d'ARN. [8]

En prolongeant ce travail, Nirenberg et Philip Leder ont révélé la nature triplet du code et déchiffré ses codons. Dans ces expériences, diverses combinaisons d'ARNm ont été passées à travers un filtre contenant des ribosomes, les composants des cellules qui traduisent l'ARN en protéine. Des triplets uniques ont favorisé la liaison d'ARNt spécifiques au ribosome. Leder et Nirenberg ont pu déterminer les séquences de 54 des 64 codons dans leurs expériences. [9] Khorana, Holley et Nirenberg ont reçu le prix Nobel 1968 pour leur travail. [dix]

Les trois codons stop ont été nommés par les découvreurs Richard Epstein et Charles Steinberg. "Amber" a été nommé d'après leur ami Harris Bernstein, dont le nom de famille signifie "ambre" en allemand. [11] Les deux autres codons d'arrêt ont été nommés "ocre" et "opale" afin de conserver le thème des "noms de couleur".

Codes génétiques étendus (biologie synthétique) Modifier

Dans un large public académique, le concept de l'évolution du code génétique du code génétique original et ambigu à un code bien défini ("gelé") avec le répertoire de 20 (+2) acides aminés canoniques est largement accepté. [12] Cependant, il existe différentes opinions, concepts, approches et idées, ce qui est le meilleur moyen de le changer expérimentalement. Même des modèles sont proposés pour prédire les « points d'entrée » pour l'invasion d'acides aminés synthétiques du code génétique. [13]

Depuis 2001, 40 acides aminés non naturels ont été ajoutés à la protéine en créant un codon unique (recodage) et une paire de transfert-ARN:aminoacyl - ARNt-synthétase correspondante pour la coder avec diverses propriétés physico-chimiques et biologiques afin d'être utilisé comme un outil pour explorer la structure et la fonction des protéines ou pour créer des protéines nouvelles ou améliorées. [14] [15]

H. Murakami et M. Sisido ont étendu certains codons pour avoir quatre et cinq bases. Steven A. Benner a construit un 65e fonctionnel (in vivo) codon. [16]

En 2015, N. Budisa, D. Söll et leurs collaborateurs ont signalé la substitution complète des 20 899 résidus tryptophane (codons UGG) par de la thiénopyrrole-alanine non naturelle dans le code génétique de la bactérie. Escherichia coli. [17]

En 2016, le premier organisme semi-synthétique stable a été créé. C'était une bactérie (unicellulaire) avec deux bases synthétiques (appelées X et Y). Les bases ont survécu à la division cellulaire. [18] [19]

En 2017, des chercheurs sud-coréens ont signalé qu'ils avaient conçu une souris avec un code génétique étendu qui peut produire des protéines avec des acides aminés non naturels. [20]

En mai 2019, les chercheurs, dans un effort marquant, ont signalé la création d'une nouvelle forme synthétique (éventuellement artificielle) de vie viable, une variante de la bactérie Escherichia coli, en réduisant le nombre naturel de 64 codons dans le génome bactérien à 59 codons à la place, afin de coder 20 acides aminés. [21] [22]

Cadre de lecture Modifier

Un cadre de lecture est défini par le triplet initial de nucléotides à partir duquel la traduction commence. Il définit le cadre d'une série de codons successifs ne se chevauchant pas, ce qui est connu sous le nom de "cadre de lecture ouvert" (ORF). Par exemple, la chaîne 5'-AAATGAACG-3' (voir figure), si lue à partir de la première position, contient les codons AAA, TGA et ACG si lue à partir de la deuxième position, elle contient les codons AAT et GAA et si lue à partir de la troisième position, il contient les codons ATG et AAC. Chaque séquence peut ainsi être lue dans sa direction 5' → 3' dans trois cadres de lecture, chacun produisant une séquence d'acides aminés éventuellement distincte : dans l'exemple donné, Lys (K)-Trp (W)-Thr (T), Asn (N)-Glu (E) ou Met (M)-Asn (N), respectivement (lors de la traduction avec le code mitochondrial des vertébrés). Lorsque l'ADN est double brin, six cadres de lecture possibles sont définis, trois dans l'orientation directe sur un brin et trois inverses sur le brin opposé. [24] : 330 Les cadres codant pour les protéines sont définis par un codon d'initiation, généralement le premier codon AUG (ATG) dans la séquence d'ARN (ADN).

Chez les eucaryotes, les ORF dans les exons sont souvent interrompus par des introns.

Codons de démarrage et d'arrêt Modifier

La traduction commence par un codon d'initiation de chaîne ou un codon de départ. Le codon de départ seul n'est pas suffisant pour démarrer le processus. Des séquences voisines telles que la séquence Shine-Dalgarno dans E. coli et des facteurs d'initiation sont également nécessaires pour démarrer la traduction. Chez les eucaryotes, le codon d'initiation est situé entre la séquence kozak. [25] Le codon de départ le plus courant est AUG, qui se lit comme la méthionine ou, dans les bactéries, comme la formylméthionine. Des codons d'initiation alternatifs en fonction de l'organisme incluent « GUG » ou « UUG », ces codons représentent normalement la valine et la leucine, respectivement, mais en tant que codons d'initiation, ils sont traduits par méthionine ou formylméthionine. [26]

Les trois codons stop ont des noms : UAG est ambre, UGA est opale (parfois aussi appelé ombre), et la SAU est ocre. Les codons d'arrêt sont également appelés codons "de terminaison" ou "non-sens". Ils signalent la libération du polypeptide naissant du ribosome car aucun ARNt apparenté n'a d'anticodons complémentaires à ces signaux d'arrêt, permettant à un facteur de libération de se lier au ribosome à la place. [27]

Effet des mutations Modifier

Au cours du processus de réplication de l'ADN, des erreurs se produisent parfois dans la polymérisation du deuxième brin. Ces erreurs, mutations, peuvent affecter le phénotype d'un organisme, surtout si elles se produisent dans la séquence codant pour la protéine d'un gène. Les taux d'erreur sont généralement de 1 erreur sur 10 à 100 millions de bases, en raison de la capacité de « relecture » ​​des ADN polymérases. [29] [30]

Les mutations faux-sens et les mutations non-sens sont des exemples de mutations ponctuelles qui peuvent provoquer des maladies génétiques telles que la drépanocytose et la thalassémie respectivement. [31] [32] [33] Les mutations faux-sens cliniquement importantes changent généralement les propriétés du résidu d'acide aminé codé parmi les états basiques, acides, polaires ou non polaires, alors que les mutations non-sens aboutissent à un codon d'arrêt. [24]

Les mutations qui perturbent la séquence du cadre de lecture par des indels (insertions ou délétions) d'un non-multiple de 3 bases nucléotidiques sont appelées mutations par décalage du cadre de lecture. Ces mutations entraînent généralement une traduction complètement différente de l'originale et provoquent probablement la lecture d'un codon d'arrêt, qui tronque la protéine. [34] Ces mutations peuvent altérer la fonction de la protéine et sont donc rares chez in vivo séquences codant pour les protéines. L'une des raisons pour lesquelles l'hérédité des mutations de décalage du cadre de lecture est rare est que, si la protéine traduite est essentielle à la croissance sous les pressions sélectives auxquelles l'organisme est confronté, l'absence d'une protéine fonctionnelle peut entraîner la mort avant que l'organisme ne devienne viable. [35] Les mutations Frameshift peuvent entraîner des maladies génétiques graves telles que la maladie de Tay-Sachs. [36]

Bien que la plupart des mutations qui modifient les séquences protéiques soient nocives ou neutres, certaines mutations présentent des avantages. [37] Ces mutations peuvent permettre à l'organisme mutant de mieux résister à des stress environnementaux particuliers que les organismes de type sauvage, ou de se reproduire plus rapidement. Dans ces cas, une mutation aura tendance à devenir plus fréquente dans une population par sélection naturelle. [38] Les virus qui utilisent l'ARN comme matériel génétique ont des taux de mutation rapides, [39] ce qui peut être un avantage, car ces virus évoluent ainsi rapidement, et échappent ainsi aux réponses défensives du système immunitaire. [40] Dans de grandes populations d'organismes à reproduction asexuée, par exemple, E. coli, plusieurs mutations bénéfiques peuvent coexister. Ce phénomène est appelé interférence clonale et provoque une compétition entre les mutations. [41]

Dégénérescence Modifier

La dégénérescence est la redondance du code génétique. Ce terme a été donné par Bernfield et Nirenberg. Le code génétique a une redondance mais aucune ambiguïté (voir les tableaux de codons ci-dessous pour la corrélation complète). Par exemple, bien que les codons GAA et GAG spécifient tous deux l'acide glutamique (redondance), aucun ne spécifie un autre acide aminé (aucune ambiguïté). Les codons codant pour un acide aminé peuvent différer dans n'importe laquelle de leurs trois positions. Par exemple, l'acide aminé leucine est spécifié par OuiUR ou CUN (UUA, UUG, CUU, CUC, CUA ou CUG) (différence dans la première ou la troisième position indiquée par la notation IUPAC), tandis que l'acide aminé sérine est spécifié par UCN ou AGOui (UCA, UCG, UCC, UCU, AGU ou AGC) (différence en première, deuxième ou troisième position). [42] Une conséquence pratique de la redondance est que les erreurs dans la troisième position du codon triplet ne provoquent qu'une mutation silencieuse ou une erreur qui n'affecterait pas la protéine car l'hydrophilie ou l'hydrophobie est maintenue par substitution équivalente d'acides aminés, par exemple, un codon de NUN (où N = n'importe quel nucléotide) tend à coder pour les acides aminés hydrophobes. NCN donne des résidus d'acides aminés qui sont de petite taille et modérément hydropathiques. NAN code pour des résidus hydrophiles de taille moyenne. Le code génétique est si bien structuré pour l'hydropathie qu'une analyse mathématique (Singular Value Decomposition) de 12 variables (4 nucléotides x 3 positions) donne une corrélation remarquable (C = 0,95) pour prédire l'hydropathie de l'acide aminé codé directement à partir du séquence nucléotidique triplet, sans traduction. [43] [44] Notez dans le tableau ci-dessous, huit acides aminés ne sont pas du tout affectés par des mutations à la troisième position du codon, alors que dans la figure ci-dessus, une mutation à la deuxième position est susceptible de provoquer un changement radical dans les propriétés physico-chimiques de l'acide aminé codé. Néanmoins, les changements de la première position des codons sont plus importants que les changements de la deuxième position à l'échelle mondiale. [45] La raison peut être que l'inversion de charge (d'une charge positive à une charge négative ou vice versa) ne peut se produire que lors de mutations dans la première position de certains codons, mais pas lors de changements dans la deuxième position d'un codon. Une telle inversion de charge peut avoir des conséquences dramatiques pour la structure ou la fonction d'une protéine. Cet aspect a peut-être été largement sous-estimé par les études précédentes. [45]

Biais d'utilisation des codons Modifier

La fréquence des codons, également connue sous le nom de biais d'utilisation des codons, peut varier d'une espèce à l'autre avec des implications fonctionnelles pour le contrôle de la traduction.

Acides aminés non standard Modifier

Dans certaines protéines, des acides aminés non standard remplacent les codons d'arrêt standard, en fonction des séquences signal associées dans l'ARN messager. Par exemple, UGA peut coder pour la sélénocystéine et UAG peut coder pour la pyrrolysine. La sélénocystéine est devenue le 21e acide aminé et la pyrrolysine le 22e. [47] Contrairement à la sélénocystéine, l'UAG codé par la pyrrolysine est traduit avec la participation d'une aminoacyl-ARNt synthétase dédiée. [48] ​​La sélénocystéine et la pyrrolysine peuvent être présentes dans le même organisme. [47] Bien que le code génétique soit normalement fixé dans un organisme, le procaryote achéen Acetohalobium arabaticum peut étendre son code génétique de 20 à 21 acides aminés (en incluant la pyrrolysine) dans différentes conditions de croissance. [49]

Variantes Modifier

Des variations sur le code standard ont été prédites dans les années 1970. [50] Le premier a été découvert en 1979, par des chercheurs étudiant les gènes mitochondriaux humains. [51] De nombreuses variantes légères ont été découvertes par la suite, [52] y compris divers codes mitochondriaux alternatifs. [53] Ces variantes mineures impliquent par exemple la traduction du codon UGA en tryptophane dans Mycoplasme et la traduction de CUG en sérine plutôt qu'en leucine dans les levures du « clade CTG » (comme Candida albicans).[54] [55] [56] Parce que les virus doivent utiliser le même code génétique que leurs hôtes, les modifications du code génétique standard pourraient interférer avec la synthèse ou le fonctionnement des protéines virales. Cependant, des virus tels que les totivirus se sont adaptés à la modification du code génétique de l'hôte. [57] Chez les bactéries et les archées, GUG et UUG ​​sont des codons d'initiation communs. Dans de rares cas, certaines protéines peuvent utiliser des codons d'initiation alternatifs. [52] Étonnamment, des variations dans l'interprétation du code génétique existent également dans les gènes humains à codage nucléaire : en 2016, des chercheurs étudiant la traduction de la malate déshydrogénase ont découvert que dans environ 4 % des ARNm codant pour cette enzyme, le codon d'arrêt est naturellement utilisé. pour coder les acides aminés tryptophane et arginine. [58] Ce type de recodage est induit par un contexte de codon stop à lecture élevée [59] et est appelé lecture traductionnelle fonctionnelle. [60]

Les codes génétiques variants utilisés par un organisme peuvent être déduits en identifiant des gènes hautement conservés codés dans ce génome et en comparant son utilisation des codons aux acides aminés dans les protéines homologues d'autres organismes. Par exemple, le programme FACIL [61] déduit un code génétique en recherchant quels acides aminés dans les domaines protéiques homologues sont le plus souvent alignés sur chaque codon. Les probabilités d'acides aminés résultantes pour chaque codon sont affichées dans un logo de code génétique, qui montre également le support d'un codon d'arrêt.

Malgré ces différences, tous les codes naturels connus sont très similaires. Le mécanisme de codage est le même pour tous les organismes : codons à trois bases, ARNt, ribosomes, lecture unidirectionnelle et traduction de codons simples en acides aminés simples. [62] Les variations les plus extrêmes se produisent dans certains ciliés où la signification des codons d'arrêt dépend de leur position dans l'ARNm. Lorsqu'ils sont proches de l'extrémité 3 ', ils agissent comme des terminateurs tandis que dans les positions internes, ils codent pour les acides aminés comme dans Condylostome magnum [63] ou déclencher un frameshifting ribosomique comme dans Euplotes. [64]

Le code génétique est un élément clé de l'histoire de la vie, selon une version selon laquelle les molécules d'ARN auto-répliquantes ont précédé la vie telle que nous la connaissons. C'est l'hypothèse du monde de l'ARN. Dans cette hypothèse, tout modèle d'émergence du code génétique est intimement lié à un modèle de transfert des ribozymes (enzymes ARN) aux protéines en tant qu'enzymes principales dans les cellules. Conformément à l'hypothèse du monde de l'ARN, les molécules d'ARN de transfert semblent avoir évolué avant les aminoacyl-ARNt synthétases modernes, de sorte que ces dernières ne peuvent pas faire partie de l'explication de ses modèles. [65]

Un code génétique hypothétique évolué au hasard motive en outre un modèle biochimique ou évolutif pour son origine. Si les acides aminés étaient assignés au hasard aux codons triplets, il y aurait 1,5 × 10 84 codes génétiques possibles. [66] : 163 Ce nombre est trouvé en calculant le nombre de façons dont 21 éléments (20 acides aminés plus un arrêt) peuvent être placés dans 64 bacs, où chaque élément est utilisé au moins une fois. [67] Cependant, la distribution des affectations de codons dans le code génétique n'est pas aléatoire. [68] En particulier, le code génétique regroupe certaines affectations d'acides aminés.

Les acides aminés qui partagent la même voie de biosynthèse ont tendance à avoir la même première base dans leurs codons. Cela pourrait être une relique évolutive d'un code génétique précoce et plus simple avec moins d'acides aminés qui a ensuite évolué pour coder un plus grand ensemble d'acides aminés. [69] Cela pourrait également refléter des propriétés stériques et chimiques qui ont eu un autre effet sur le codon au cours de son évolution. Les acides aminés ayant des propriétés physiques similaires ont également tendance à avoir des codons similaires, [70] [71] réduisant les problèmes causés par les mutations ponctuelles et les erreurs de traduction. [68]

Compte tenu du schéma de codage de triplet génétique non aléatoire, une hypothèse défendable pour l'origine du code génétique pourrait aborder plusieurs aspects de la table de codons, tels que l'absence de codons pour les acides aminés D, les modèles de codons secondaires pour certains acides aminés, le confinement de synonymes. positions à la troisième position, le petit ensemble de seulement 20 acides aminés (au lieu d'un nombre approchant 64), et la relation entre les modèles de codon stop et les modèles de codage d'acides aminés. [72]

Trois hypothèses principales portent sur l'origine du code génétique. De nombreux modèles appartiennent à l'un d'eux ou à un hybride : [73]

  • Gel aléatoire : le code génétique a été créé au hasard. Par exemple, les premiers ribozymes de type ARNt peuvent avoir eu des affinités différentes pour les acides aminés, avec des codons émergeant d'une autre partie du ribozyme qui présentait une variabilité aléatoire. Une fois que suffisamment de peptides ont été codés, tout changement aléatoire majeur dans le code génétique aurait été mortel et il est donc devenu « congelé ». [74]
  • Affinité stéréochimique : le code génétique est le résultat d'une affinité élevée entre chaque acide aminé et son codon ou anti-codon, cette dernière option implique que les molécules de pré-ARNt correspondent à leurs acides aminés correspondants par cette affinité. Plus tard au cours de l'évolution, cet appariement a été progressivement remplacé par un appariement par des aminoacyl-ARNt synthétases. [72][75][76]
  • Optimalité : le code génétique a continué à évoluer après sa création initiale, de sorte que le code actuel maximise certaines fonctions de fitness, généralement une sorte de minimisation des erreurs. [72][73]

Les hypothèses ont abordé une variété de scénarios : [77]

  • Les principes chimiques régissent l'interaction spécifique de l'ARN avec les acides aminés. Des expériences avec des aptamères ont montré que certains acides aminés ont une affinité chimique sélective pour leurs codons. [78] Les expériences ont montré que sur 8 acides aminés testés, 6 montrent une association triple ARN-acide aminé. [66][76]
  • Expansion biosynthétique. Le code génétique s'est développé à partir d'un code antérieur plus simple grâce à un processus d'« expansion biosynthétique ». La vie primordiale a « découvert » de nouveaux acides aminés (par exemple, en tant que sous-produits du métabolisme) et a ensuite incorporé certains d'entre eux dans la machinerie du codage génétique. [79] Bien que de nombreuses preuves circonstancielles aient été trouvées pour suggérer que moins de types d'acides aminés ont été utilisés dans le passé, [80] les hypothèses précises et détaillées sur les acides aminés entrés dans le code dans quel ordre sont controversées. [81][82] Cependant, plusieurs études ont suggéré que Gly, Ala, Asp, Val, Ser, Pro, Glu, Leu, Thr pourraient appartenir à un groupe d'acides aminés à addition précoce, alors que Cys, Met, Tyr, Trp , His, Phe peuvent appartenir à un groupe d'acides aminés à addition ultérieure. [83][84][85][86]
  • La sélection naturelle a conduit à des affectations de codons du code génétique qui minimisent les effets des mutations. [87] Une hypothèse récente [88] suggère que le code triplet était dérivé de codes qui utilisaient plus de codons triplet (tels que les codons quadruplets). Un décodage plus long que triplet augmenterait la redondance des codons et serait plus résistant aux erreurs. Cette fonctionnalité pourrait permettre un décodage précis en l'absence d'une machinerie de traduction complexe telle que le ribosome, comme avant que les cellules ne commencent à fabriquer des ribosomes.
  • Canaux d'information : Les approches théoriques de l'information modélisent le processus de traduction du code génétique en acides aminés correspondants en tant que canal d'information sujet aux erreurs. [89] Le bruit inhérent (c'est-à-dire l'erreur) dans le canal pose à l'organisme une question fondamentale : comment un code génétique peut-il être construit pour résister au bruit [90] tout en traduisant avec précision et efficacité l'information ? Ces modèles de « taux-distorsion » [91] suggèrent que le code génétique est né de l'interaction de trois forces évolutives en conflit : les besoins en divers acides aminés, [92] pour la tolérance aux erreurs [87] et pour des ressources minimales Coût. Le code émerge à une transition lorsque la cartographie des codons en acides aminés devient non aléatoire. L'émergence du code est régie par la topologie définie par les erreurs probables et est liée au problème de coloration de la carte. [93]
  • Théorie des jeux : Les modèles basés sur les jeux de signalisation combinent des éléments de théorie des jeux, de sélection naturelle et de canaux d'information. De tels modèles ont été utilisés pour suggérer que les premiers polypeptides étaient probablement courts et avaient une fonction non enzymatique. Les modèles de la théorie des jeux suggèrent que l'organisation des chaînes d'ARN dans les cellules peut avoir été nécessaire pour empêcher l'utilisation « trompeuse » du code génétique, c'est-à-dire empêcher l'ancien équivalent des virus de submerger le monde de l'ARN. [94]
  • Codons d'arrêt : Les codons pour les arrêts de traduction sont également un aspect intéressant du problème de l'origine du code génétique. A titre d'exemple pour aborder l'évolution des codons d'arrêt, il a été suggéré que les codons d'arrêt sont tels qu'ils sont le plus susceptibles de terminer la traduction tôt dans le cas d'une erreur de décalage de trame. [95] En revanche, certains modèles moléculaires stéréochimiques expliquent l'origine des codons d'arrêt comme "inassignables". [72]
  1. ^ uneb Shu, Jian-Jun (2017). « Une nouvelle table symétrique intégrée pour les codes génétiques ». BioSystèmes. 151: 21–26. arXiv : 1703.03787. Code bibliographique : 2017arXiv170303787S. doi:10.1016/j.biosystems.2016.11.004. PMID27887904. S2CID1121152.
  2. ^
  3. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN (janvier 2009). "Le code génétique prend en charge l'insertion ciblée de deux acides aminés par un codon". Science. 323 (5911) : 259–61. doi:10.1126/science.1164748. PMC3088105 . PMID19131629.
  4. ^
  5. Crick, Francis (10 juillet 1990). "Chapitre 8: Le code génétique". Quelle poursuite folle : une vision personnelle de la découverte scientifique. Livres de base. p. 89-101. ISBN978-0-465-09138-6.
  6. ^
  7. Yanofsky, Charles (9 mars 2007). « L'établissement de la nature triplet du code génétique ». Cellule. 128 (5) : 815-818. doi:10.1016/j.cell.2007.02.029. PMID17350564. S2CID14249277 . Récupéré le 9 octobre 2020 .
  8. ^
  9. Nirenberg MW, Matthaei JH (octobre 1961). « La dépendance de la synthèse des protéines sans cellules dans E. coli sur les polyribonucléotides naturels ou synthétiques ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 47 (10) : 1588–602. Code bibliographique : 1961PNAS. 47.1588N. doi: 10.1073/pnas.47.10.1588. PMC223178. PMID14479932.
  10. ^
  11. Gardner RS, Wahba AJ, Basilio C, Miller RS, Lengyel P, Speyer JF (décembre 1962). « Les polynucléotides synthétiques et le code d'acides aminés. VII ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 48 (12) : 2087-2094. Code Bib : 1962PNAS. 48.2087G. doi: 10.1073/pnas.48.12.2087. PMC221128 . PMID13946552.
  12. ^
  13. Wahba AJ, Gardner RS, Basilio C, Miller RS, Speyer JF, Lengyel P (janvier 1963). "Les polynucléotides synthétiques et le code d'acide aminé. VIII". Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 49 (1) : 116-22. Code Bib : 1963PNAS. 49.116W. doi: 10.1073/pnas.49.1.116. PMC300638 . PMID13998282.
  14. ^
  15. "Le prix Nobel de physiologie ou médecine 1959" (communiqué de presse). L'Académie royale suédoise des sciences. 1959 . Récupéré le 27 février 2010 . Le prix Nobel de physiologie ou médecine 1959 a été décerné conjointement à Severo Ochoa et Arthur Kornberg « pour leur découverte des mécanismes de la synthèse biologique de l'acide ribonucléique et de l'acide désoxyribonucléique ».
  16. ^
  17. Nirenberg M, Leder P, Bernfield M, Brimacombe R, Trupin J, Rottman F, O'Neal C (mai 1965). « Mots de code ARN et synthèse protéique, VII. Sur la nature générale du code ARN ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 53 (5) : 1161–8. Code bibliographique : 1965PNAS. 53.1161N. doi: 10.1073/pnas.53.5.1161. PMC301388 . PMID5330357.
  18. ^
  19. "Le prix Nobel de physiologie ou médecine 1968" (communiqué de presse). L'Académie royale suédoise des sciences. 1968 . Récupéré le 27 février 2010 . Le prix Nobel de physiologie ou médecine 1968 a été décerné conjointement à Robert W. Holley, Har Gobind Khorana et Marshall W. Nirenberg « pour leur interprétation du code génétique et de sa fonction dans la synthèse des protéines ».
  20. ^
  21. Edgar B (octobre 2004). « Le génome du bactériophage T4 : une fouille archéologique ». La génétique. 168 (2) : 575-82. doi: 10.1093/génétique/168.2.575. PMC1448817 . PMID15514035.
  22. ^
  23. Budisa, Nediljko (23 décembre 2005). Le livre à la bibliothèque en ligne Wiley. doi:10.1002/3527607188. ISBN9783527312436 .
  24. ^
  25. Kubyshkin, V. Budisa, N. (2017). « L'aliénation synthétique d'organismes microbiens en utilisant le génie génétique : pourquoi et comment ? ». Revue de biotechnologie. 12 (8) : 1600097. doi : 10.1002/biot.201600097. PMID28671771.
  26. ^
  27. Xie J, Schultz PG (décembre 2005). "Ajout d'acides aminés au répertoire génétique". Opinion actuelle en biologie chimique. 9 (6) : 548-54. doi:10.1016/j.cbpa.2005.10.011. PMID16260173.
  28. ^
  29. Wang Q, Parrish AR, Wang L (mars 2009). « Élargir le code génétique pour les études biologiques ». Chimie et biologie. 16 (3) : 323–36. doi:10.1016/j.chembiol.2009.03.001. PMC2696486. PMID19318213.
  30. ^
  31. Simon M (7 janvier 2005). Calcul émergent : mettre l'accent sur la bioinformatique. Springer Science & Business Media. p. 105-106. ISBN978-0-387-22046-8.
  32. ^
  33. Hoesl, M.G. Oehm, S. Durkin, P. Darmon, E. Peil, L. Aerni, H.-R. Rappsilber, J. Rinehart, J. Leach, D. Söll, D. Budisa, N. (2015). « L'évolution chimique d'un protéome bactérien ». Angewandte Chemie Édition Internationale. 54 (34) : 10030–10034. doi: 10.1002/anie.201502868. PMC4782924. PMID26136259. NIHMSID : NIHMS711205
  34. ^
  35. "Le premier organisme semi-synthétique stable créé | KurzweilAI". www.kurzweilai.net. 3 février 2017 . Récupéré le 9 février 2017 .
  36. ^
  37. Zhang Y, Lamb BM, Feldman AW, Zhou AX, Lavergne T, Li L, Romesberg FE (février 2017). « Un organisme semi-synthétique conçu pour l'expansion stable de l'alphabet génétique ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 114 (6) : 1317-1322. doi: 10.1073/pnas.1616443114. PMC5307467 . PMID28115716.
  38. ^
  39. Han S, Yang A, Lee S, Lee HW, Park CB, Park HS (février 2017). « Développer le code génétique de Mus musculus ». Communication Nature. 8: 14568. Code bibliographique : 2017NatCo. 814568H. doi: 10.1038/ncomms14568. PMC5321798 . PMID28220771.
  40. ^
  41. Zimmer, Carl (15 mai 2019). "Les scientifiques ont créé des bactéries avec un génome synthétique. Est-ce une vie artificielle? - Dans une étape importante pour la biologie synthétique, les colonies d'E. coli prospèrent avec de l'ADN construit à partir de zéro par les humains, pas par la nature". Le New York Times . Consulté le 16 mai 2019 .
  42. ^
  43. Fredens, Julius et al. (15 mai 2019). « Synthèse totale d'Escherichia coli avec un génome recodé ». La nature. 569 (7757): 514-518. Code bibliographique : 2019Natur.569..514F. doi: 10.1038/s41586-019-1192-5. PMC7039709 . PMID31092918. S2CID205571025.
  44. ^Homo sapiens mitochondrie, génome complet. "Séquence de référence Cambridge révisée (rCRS): accession NC_012920", Centre national d'information sur la biotechnologie. Consulté le 27 décembre 2017.
  45. ^ uneb
  46. King RC, Mulligan P, Stansfield W (10 janvier 2013). Un dictionnaire de génétique. OUP États-Unis. p. 608. ISBN978-0-19-976644-4.
  47. ^
  48. Sardhara, Harshil (21 mars 2021). « Front des biotechnologies ». Biotechfront.com.
  49. ^
  50. Touriol C, Bornes S, Bonnal S, Audigier S, Prats H, Prats AC, Vagner S (2003). « Génération de la diversité des isoformes de protéines par initiation alternative de la traduction à des codons non-AUG ». Biologie de la cellule. 95 (3-4): 169-78. doi: 10.1016/S0248-4900(03)00033-9 . PMID12867081.
  51. ^
  52. Maloy S (29 novembre 2003). "Comment les mutations absurdes ont obtenu leurs noms". Cours de génétique microbienne. Université d'État de San Diego. Récupéré le 10 mars 2010 .
  53. ^ Les références de l'image se trouvent sur la page Wikimedia Commons à l'adresse : Commons:File:Notable mutations.svg#References.
  54. ^
  55. Griffiths AJ, Miller JH, Suzuki DT, Lewontin RC, et al., éd. (2000). « Mutations spontanées ». Une introduction à l'analyse génétique (7e éd.). New York : W.H. Freeman. ISBN978-0-7167-3520-5.
  56. ^
  57. Freisinger E, Grollman AP, Miller H, Kisker C (avril 2004). "La (in)tolérance aux lésions révèle des informations sur la fidélité de réplication de l'ADN". Le Journal de l'EMBO. 23 (7) : 1494–505. doi: 10.1038/sj.emboj.7600158. PMC391067 . PMID15057282.
  58. ^ (Boillée 2006, p. 39) erreur harv : pas de cible : CITEREFBoillée2006 (aide)
  59. ^
  60. Chang JC, Kan YW (juin 1979). « bêta 0 thalassémie, une mutation absurde chez l'homme ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 76 (6) : 2886-9. Code bibliographique : 1979PNAS. 76.2886C. doi: 10.1073/pnas.76.6.2886. PMC383714 . PMID88735.
  61. ^
  62. Boillée S, Vande Velde C, Cleveland DW (octobre 2006). « SLA : une maladie des motoneurones et de leurs voisins non neuronaux ». Neurone. 52 (1) : 39-59. doi: 10.1016/j.neuron.2006.09.018 . PMID17015226.
  63. ^
  64. Isbrandt D, Hopwood JJ, von Figura K, Peters C (1996). « Deux nouvelles mutations de décalage du cadre provoquant des codons d'arrêt prématurés chez un patient atteint de la forme sévère du syndrome de Maroteaux-Lamy ». Mutation humaine. 7 (4) : 361-3. doi:10.1002/(SICI)1098-1004(1996)7:4<361::AID-HUMU12>3.0.CO2-0. PMID8723688.
  65. ^
  66. Corbeau JF (1993). « Que savons-nous des taux de mutation humaine spontanée ? » Mutagenèse environnementale et moléculaire. 21 (2) : 122–9. doi: 10.1002/em.2850210205. PMID8444142. S2CID32918971.
  67. ^
  68. Lewis R (2005). Génétique humaine : concepts et applications (6e éd.). Boston, Mass. : McGraw Hill. p. 227-228. ISBN978-0-07-111156-0 .
  69. ^
  70. Sawyer SA, Parsch J, Zhang Z, Hartl DL (avril 2007). « Prévalence de la sélection positive parmi les remplacements d'acides aminés presque neutres chez la drosophile ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 104 (16) : 6504-10. Code Bib : 2007PNAS..104.6504S. doi: 10.1073/pnas.0701572104. PMC1871816 . PMID17409186.
  71. ^
  72. Ponts KR (2002). "Le paludisme et la cellule rouge". Harvard. Archivé de l'original le 27 novembre 2011.
  73. ^
  74. Drake JW, Holland JJ (novembre 1999). « Les taux de mutation parmi les virus à ARN ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 96 (24) : 13910-3. Code bibliographique : 1999PNAS. 9613910D. doi: 10.1073/pnas.96.24.13910. PMC24164. PMID10570172.
  75. ^
  76. Holland J, Spindler K, Horodyski F, Grabau E, Nichol S, VandePol S (mars 1982). « Évolution rapide des génomes à ARN ». Science. 215 (4540) : 1577-1585. Code Bib : 1982Sci. 215.1577H. doi:10.1126/science.7041255. PMID7041255.
  77. ^
  78. de Visser JA, Rozen DE (avril 2006). « L'interférence clonale et la sélection périodique de nouvelles mutations bénéfiques dans Escherichia coli ». La génétique. 172 (4) : 2093–100. doi: 10.1534/génétique.105.052373. PMC1456385 . PMID16489229.
  79. ^
  80. Watson, James D. (2008). Biologie moléculaire du gène. Pearson/Benjamin Cummings. ISBN978-0-8053-9592-1. : 102-117 : 521-522
  81. ^
  82. Michel-Beyerle, Maria Elisabeth (1990). Centres de réaction des bactéries photosynthétiques : Feldafing-II-Meeting. Springer-Verlag. ISBN978-3-540-53420-4.
  83. ^ Füllen G, Youvan DC (1994). "Algorithmes génétiques et mutagenèse d'ensemble récursif dans l'ingénierie des protéines". Complexité Internationale 1.
  84. ^ uneb
  85. Fricke, Markus (2019). « Importance mondiale des structures secondaires d'ARN dans les séquences codant pour les protéines ». Bioinformatique. 35 (4) : 579-583. doi: 10.1093/bioinformatique/bty678. PMC7109657 . PMID30101307. S2CID51968530.
  86. ^
  87. "Tableau d'utilisation des codons".
  88. ^ uneb
  89. Zhang Y, Baranov PV, Atkins JF, Gladyshev VN (mai 2005). « La pyrrolysine et la sélénocystéine utilisent des stratégies de décodage différentes ». Le Journal de Chimie Biologique. 280 (21) : 20740–51. doi: 10.1074/jbc.M501458200 . PMID15788401.
  90. ^
  91. Le juge Krzycki (décembre 2005). « Le codage génétique direct de la pyrrolysine ». Opinion actuelle en microbiologie. 8 (6) : 706-12. doi:10.1016/j.mib.2005.10.009. PMID16256420.
  92. ^
  93. Prat L, Heinemann IU, Aerni HR, Rinehart J, O'Donoghue P, Söll D (décembre 2012). « Expansion dépendante de la source de carbone du code génétique chez les bactéries ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 109 (51) : 21070-5. Code bibliographique : 2012PNAS..10921070P. doi: 10.1073/pnas.1218613110. PMC3529041 . PMID23185002.
  94. ^
  95. Crick FH, Orgel LE (1973). "La panspermie dirigée". Icare. 19 (3) : 341–6, 344. Code bibliographique : 1973Icar. 19..341C. doi:10.1016/0019-1035(73)90110-3. Il est un peu surprenant que des organismes aux codes quelque peu différents ne coexistent pas. (Plus de discussion)
  96. ^
  97. Barrell BG, Bankier AT, Drouin J (1979). « Un code génétique différent dans les mitochondries humaines ». La nature. 282 (5735) : 189-194. Code Bib : 1979Natur.282..189B. doi:10.1038/282189a0. PMID226894. S2CID4335828. ([1])
  98. ^ uneb
  99. Elzanowski A, Ostell J (7 avril 2008). "Les codes génétiques". Centre national d'information sur la biotechnologie (NCBI) . Récupéré le 10 mars 2010 .
  100. ^
  101. Jukes TH, Osawa S (décembre 1990). « Le code génétique dans les mitochondries et les chloroplastes ». Expérience. 46 (11-12) : 1117-26. doi:10.1007/BF01936921. PMID2253709. S2CID19264964.
  102. ^
  103. Fitzpatrick DA, Logue ME, Stajich JE, Butler G (1er janvier 2006). « Une phylogénie fongique basée sur 42 génomes complets dérivés de supertree et d'une analyse génétique combinée ». BMC Biologie évolutive. 6: 99. doi:10.1186/1471-2148-6-99. PMC1679813 . PMID17121679.
  104. ^
  105. Santos MA, Tuite MF (mai 1995). « Le codon CUG est décodé in vivo sous forme de sérine et non de leucine chez Candida albicans ». Recherche sur les acides nucléiques. 23 (9) : 1481–6. doi: 10.1093/nar/23.9.1481. PMC306886 . PMID7784200.
  106. ^
  107. Butler G, Rasmussen MD, Lin MF, et al. (juin 2009). « Évolution de la pathogénicité et de la reproduction sexuée dans huit génomes de Candida ». La nature. 459 (7247) : 657-62. Code bibliographique : 2009Natur.459..657B. doi: 10.1038/nature08064. PMC2834264. PMID19465905.
  108. ^
  109. Taylor DJ, Ballinger MJ, Bowman SM, Bruenn JA (2013). « Co-évolution virus-hôte sous un code génétique nucléaire modifié ». PairJ. 1: e50. doi : 10.7717/peerj.50. PMC3628385 . PMID23638388.
  110. ^
  111. Hofhuis J, Schueren F, Nötzel C, Lingner T, Gärtner J, Jahn O, Thoms S (2016). « L'extension de lecture fonctionnelle de la malate déshydrogénase révèle une modification du code génétique ». Ouvrir Biol. 6 (11) : 160246. doi : 10.1098/rsob.160246. PMC5133446 . PMID27881739.
  112. ^
  113. Schueren F, Lingner T, George R, Hofhuis J, Gartner J, Thoms S (2014). « La lactate déshydrogénase peroxysomale est générée par lecture traductionnelle chez les mammifères ». eLife. 3: e03640. doi:10.7554/eLife.03640. PMC4359377. PMID25247702.
  114. ^
  115. F. Schueren et S. Thoms (2016). "Relecture Translationnelle Fonctionnelle : Une Perspective de Biologie des Systèmes". PLOS Génétique. 12 (8) : e1006196. doi: 10.1371/journal.pgen.1006196. PMC4973966 . PMID27490485.
  116. ^
  117. Dutilh BE, Jurgelenaite R, Szklarczyk R, van Hijum SA, Harhangi HR, Schmid M, de Wild B, Françoijs KJ, Stunnenberg HG, Strous M, Jetten MS, Op den Camp HJ, Huynen MA (juillet 2011). "FACIL: Inférence de code génétique rapide et précise et logo". Bioinformatique. 27 (14) : 1929-1933. doi: 10.1093/bioinformatique/btr316. PMC3129529 . PMID21653513.
  118. ^
  119. Kubyshkin V, Acevedo-Rocha CG, Budisa N (février 2018). « Sur les événements de codage universels dans la biogenèse des protéines ». Systèmes biologiques. 164: 16-25. doi: 10.1016/j.biosystems.2017.10.004 . PMID29030023.
  120. ^
  121. Heaphy SM, Mariotti M, Gladyshev VN, Atkins JF, Baranov PV (novembre 2016). "Nouvelles variantes du code génétique cilié, y compris la réaffectation des trois codons d'arrêt aux codons sens dans Condylostome magnum". Biologie moléculaire et évolution. 33 (11) : 2885-2889. doi: 10.1093/molbev/msw166. PMC5062323 . PMID27501944.
  122. ^
  123. Lobanov AV, Heaphy SM, Turanov AA, Gerashchenko MV, Pucciarelli S, Devaraj RR, et al. (janvier 2017). « Résiliation en fonction de la position et changement de cadre obligatoire généralisé dans Euplotes Traduction". Biologie structurale et moléculaire de la nature. 24 (1) : 61-68. doi: 10.1038/nsmb.3330. PMC5295771 . PMID27870834.
  124. ^
  125. Ribas de Pouplana L, Turner RJ, Steer BA, Schimmel P (septembre 1998). « Origines du code génétique : des ARNt plus anciens que leurs synthétases ? ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 95 (19) : 11295-300. Code bibliographique : 1998PNAS. 9511295D. doi:10.1073/pnas.95.19.11295. PMC21636 . PMID9736730.
  126. ^ uneb
  127. Yarus, Michael (2010). La vie d'un monde d'ARN : l'ancêtre intérieur. Presses de l'Université Harvard. ISBN978-0-674-05075-4.
  128. ^
  129. "Fonction Mathematica pour # arrangements possibles d'articles dans des bacs? - Groupes de discussion technique en ligne—Communauté Wolfram". communauté.wolfram.com . Récupéré le 3 février 2017 .
  130. ^ uneb
  131. Freeland SJ, Hurst LD (septembre 1998). "Le code génétique est un sur un million". Journal de l'évolution moléculaire. 47 (3) : 238-48. Code Bib : 1998JMolE..47..238F. doi:10.1007/PL00006381. PMID9732450. S2CID20130470.
  132. ^
  133. Taylor FJ, Coates D (1989). "Le code dans les codons". Systèmes biologiques. 22 (3) : 177-87. doi : 10.1016/0303-2647(89)90059-2. PMID2650752.
  134. ^
  135. Di Giulio M (octobre 1989). "L'extension atteinte par la minimisation des distances de polarité au cours de l'évolution du code génétique". Journal de l'évolution moléculaire. 29 (4) : 288-93. Code Bib : 1989JMolE..29..288D. doi:10.1007/BF02103616. PMID2514270. S2CID20803686.
  136. ^
  137. Wong JT (février 1980). « Rôle de la minimisation des distances chimiques entre les acides aminés dans l'évolution du code génétique ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 77 (2) : 1083–6. Code Bib : 1980PNAS. 77.1083W. doi:10.1073/pnas.77.2.1083. PMC348428 . PMID6928661.
  138. ^ unebc
  139. Erives A (août 2011). « Un modèle d'enzymes ARN proto-anti-codon nécessitant l'homochiralité des acides aminés L ». Journal de l'évolution moléculaire. 73 (1–2) : 10–22. Code bibliographique : 2011JMolE..73. 10E. doi:10.1007/s00239-011-9453-4. PMC3223571. PMID21779963.
  140. ^ uneb
  141. Freeland SJ, Knight RD, Landweber LF, Hurst LD (avril 2000). « Fixation précoce d'un code génétique optimal ». Biologie moléculaire et évolution. 17 (4) : 511–18. doi: 10.1093/oxfordjournals.molbev.a026331 . PMID10742043.
  142. ^
  143. Crick FH (décembre 1968). « L'origine du code génétique ». Journal de l'évolution moléculaire. 38 (3) : 367-79. doi:10.1016/0022-2836(68)90392-6. PMID4887876.
  144. ^
  145. JJ Hopfield (1978). « Origine du code génétique : une hypothèse testable basée sur la structure, la séquence et la relecture cinétique de l'ARNt ». PNAS. 75 (9) : 4334-4338. Code bibliographique : 1978PNAS. 75.4334H. doi: 10.1073/pnas.75.9.4334. PMC336109 . PMID279919.
  146. ^ uneb
  147. Yarus M, Widmann JJ, Knight R (novembre 2009). « Liaison ARN-acide aminé : une ère stéréochimique pour le code génétique ». Journal de l'évolution moléculaire. 69 (5) : 406–29. Code Bib : 2009JMolE..69..406Y. doi : 10.1007/s00239-009-9270-1. PMID19795157.
  148. ^
  149. Knight RD, Freeland SJ, Landweber LF (juin 1999). « Sélection, histoire et chimie : les trois faces du code génétique » (PDF) . Tendances en sciences biochimiques. 24 (6) : 241–7. doi:10.1016/S0968-0004(99)01392-4. PMID10366854.
  150. ^
  151. Knight RD, Landweber LF (septembre 1998). « Rime ou raison : interactions ARN-arginine et code génétique ». Chimie et biologie. 5 (9) : R215–20. doi: 10.1016/S1074-5521(98)90001-1. PMID9751648.
  152. ^
  153. Sengupta S, Higgs PG (2015). « Les voies de l'évolution du code génétique dans les organismes anciens et modernes ». Journal de l'évolution moléculaire. 80 (5–6) : 229–243. Code Bib : 2015JMolE..80..229S. doi:10.1007/s00239-015-9686-8. PMID26054480. S2CID15542587.
  154. ^
  155. Brooks DJ, Fresco JR, Lesk AM, Singh M (octobre 2002). « Évolution des fréquences d'acides aminés dans les protéines au fil du temps : ordre inféré d'introduction des acides aminés dans le code génétique ». Biologie moléculaire et évolution. 19 (10) : 1645-1655. doi: 10.1093/oxfordjournals.molbev.a003988 . PMID12270892.
  156. ^
  157. Amirnovin R (mai 1997). « Une analyse de la théorie métabolique de l'origine du code génétique ». Journal de l'évolution moléculaire. 44 (5) : 473-6. Code Bib : 1997JMolE..44..473A. doi:10.1007/PL00006170. PMID9115171. S2CID23334860.
  158. ^
  159. Ronneberg TA, Landweber LF, Freeland SJ (décembre 2000). « Tester une théorie biosynthétique du code génétique : fait ou artefact ? ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 97 (25) : 13690–5. Code bibliographique : 2000PNAS. 9713690R. doi: 10.1073/pnas.250403097. PMC17637 . PMID11087835.
  160. ^
  161. Trifonov, Edward N. (septembre 2009). « L'origine du code génétique et des premiers oligopeptides ». Recherche en microbiologie. 160 (7) : 481-486. doi:10.1016/j.resmic.2009.05.04. PMID19524038.
  162. ^
  163. Higgs, Paul G. Pudritz, Ralph E. (juin 2009). « Une base thermodynamique pour la synthèse des acides aminés prébiotiques et la nature du premier code génétique ». Astrobiologie. 9 (5) : 483-490. arXiv : 0904.0402 . Code bibliographique : 2009AsBio. 9..483H. doi:10.1089/ast.2008.0280. ISSN1531-1074. PMID19566427. S2CID9039622.
  164. ^
  165. Chaliotis, Anargyros Vlastaridis, Panayotis Mossialos, Dimitris Ibba, Michael Becker, Hubert D. Stathopoulos, Constantinos Amoutzias, Grigorios D. (17 février 2017). « L'histoire évolutive complexe des aminoacyl-ARNt synthétases ». Recherche sur les acides nucléiques. 45 (3) : 1059-1068. doi: 10.1093/nar/gkw1182. ISSN0305-1048. PMC5388404. PMID28180287.
  166. ^
  167. Ntountoumi, Chrysa Vlastaridis, Panayotis Mossialos, Dimitris Stathopoulos, Constantinos Iliopoulos, Ioannis Promponas, Vasilios Oliver, Stephen G Amoutzias, Grigoris D (4 novembre 2019). « Les régions de faible complexité dans les protéines des procaryotes remplissent des rôles fonctionnels importants et sont hautement conservées ». Recherche sur les acides nucléiques. 47 (19) : 9998–10009. doi: 10.1093/nar/gkz730. ISSN0305-1048. PMC6821194. PMID31504783.
  168. ^ uneb
  169. Freeland SJ, Wu T, Keulmann N (octobre 2003). « Le cas d'une erreur minimisant le code génétique standard ». Origines de la vie et évolution de la biosphère. 33 (4-5): 457-77. Code bibliographique : 2003OLEB. 33..457F. doi: 10.1023/A: 1025771327614. PMID14604186. S2CID18823745.
  170. ^
  171. Baranov PV, Venin M, Provan G (2009). Gemmell NJ (éd.). « La réduction de la taille du codon comme origine du code génétique triplet ». PLOS UN. 4 (5) : e5708. Code bibliographique : 2009PLoSO. 4.5708B. doi: 10.1371/journal.pone.0005708. PMC2682656. PMID19479032.
  172. ^
  173. Tlusty T (novembre 2007). « Un modèle pour l'émergence du code génétique comme transition dans un canal d'information bruyant ». Journal de biologie théorique. 249 (2) : 331–42. arXiv : 1007.4122 . doi:10.1016/j.jtbi.2007.07.029. PMID17826800. S2CID12206140.
  174. ^
  175. Sonneborn TM (1965). Bryson V, Vogel H (éd.). Gènes et protéines en évolution. New York : Presse académique. p. 377-397.
  176. ^
  177. Tlusty T (février 2008). « Scénario taux-distorsion pour l'émergence et l'évolution des codes moléculaires bruyants ». Lettres d'examen physique. 100 (4) : 048101. arXiv : 1007.4149. Code Bib : 2008PhRvL.100d8101T. doi: 10.1103/PhysRevLett.100.048101. PMID18352335. S2CID12246664.
  178. ^
  179. Sella G, Ardell DH (septembre 2006). « La coévolution des gènes et des codes génétiques : l'accident congelé de Crick revisité ». Journal de l'évolution moléculaire. 63 (3) : 297-313. Code Bib : 2006JMolE..63..297S. doi:10.1007/s00239-004-0176-7. PMID16838217. S2CID1260806.
  180. ^
  181. Tlusty T (septembre 2010). « Une origine colorée pour le code génétique : théorie de l'information, mécanique statistique et émergence des codes moléculaires ». Examens de la physique de la vie. 7 (3) : 362-76. arXiv : 1007.3906 . Code Bib : 2010PhLRv. 7..362T. doi:10.1016/j.plrev.2010.06.002. PMID20558115. S2CID1845965.
  182. ^
  183. Jee J, Sundstrom A, Massey SE, Mishra B (novembre 2013). « Que peuvent nous dire les jeux à information asymétrique sur le contexte de « l'accident gelé » de Crick ? » Journal de la Royal Society, Interface. 10 (88): 20130614. doi:10.1098/rsif.2013.0614. PMC3785830 . PMID23985735.
  184. ^
  185. Itzkovitz S, Alon U (2007). « Le code génétique est presque optimal pour permettre des informations supplémentaires dans les séquences codant pour les protéines ». Recherche sur le génome. 17 (4) : 405-412. doi: 10.1101/gr.5987307. PMC1832087. PMID17293451.
  • Griffiths AJ, Miller JH, Suzuki DT, Lewontin RC, Gilbert WM (1999). Une introduction à l'analyse génétique (7e éd.). San Francisco : W.H. Homme libre. ISBN978-0-7167-3771-1.
  • Alberts B, Johnson A, Lewis J, Raff M, Roberts K, Walter P (2002). Biologie moléculaire de la cellule (4e éd.). New York : Garland Science. ISBN978-0-8153-3218-3.
  • Lodish HF, Berk A, Zipursky SL, Matsudaira P, Baltimore D, Darnell JE (2000). Biologie cellulaire moléculaire (4e éd.). San Francisco : W.H. Homme libre. ISBN978-0-7167-3706-3.
  • Caskey CT, Leder P (avril 2014). « Le code ARN : la pierre de Rosette de la nature ». Actes de l'Académie nationale des sciences des États-Unis d'Amérique. 111 (16) : 5758-9. Code bibliographique : 2014PNAS..111.5758C. doi: 10.1073/pnas.1404819111. PMC4000803 . PMID24756939.

80 ms 7,3% type 60 ms 5,5% Scribunto_LuaSandboxCallback::callParserFunction 60 ms 5,5% Scribunto_LuaSandboxCallback::len 60 ms 5,5% Scribunto_LuaSandboxCallback::trouver 40 ms 3,6% récursifClone 40 msuntrip 3,6% Scribunto_ 220L ms 20.0% Nombre d'entités Wikibase chargées : 1/400 -->


Traduction de l'ARN en protéines

L'information génétique stockée dans l'ADN est transmise à l'ARN (par transcription) et finalement exprimée dans le langage des protéines. La biosynthèse d'une protéine ou d'un polypeptide dans une cellule vivante est appelée traduction.

Le terme traduction est utilisé pour représenter la traduction biochimique des informations du langage à quatre lettres des acides nucléiques (ADN puis ARN) au langage des protéines à 20 lettres.

La séquence d'acides aminés dans la protéine synthétisée est déterminée par la séquence de bases nucléotidiques de l'ARNm.

Variabilité des cellules en traduction:

Il existe de grandes variations dans les cellules en ce qui concerne la qualité et la quantité de protéines synthétisées. Cela dépend en grande partie du besoin et de la capacité des cellules. Les érythrocytes (globules rouges) n'ont pas la machinerie nécessaire à la traduction et ne peuvent donc pas synthétiser de protéines.

En général, les cellules en croissance et en division produisent de plus grandes quantités de protéines. Certaines cellules synthétisent en continu des protéines pour l'exportation. Par exemple, les cellules hépatiques produisent de l'albumine et des facteurs de coagulation sanguine à exporter dans le sang pour la circulation. Les cellules hépatiques normales sont très riches en mécanismes de biosynthèse des protéines, et ainsi le foie peut être considéré comme l'usine de protéines dans le corps humain.

Code génétique:

Les trois séquences de bases de nucléotides (triplets) dans l'ARNm qui agissent comme des mots de code pour les acides aminés dans la protéine constituent le code génétique ou simplement des codons. Le code génétique peut être considéré comme un dictionnaire de bases nucléotidiques (A, G, C et U) qui détermine la séquence des acides aminés dans les protéines.

Les codons sont composés des quatre bases nucléotidiques, à savoir les purines - adénine (A) et guanine (G), et les pyrimidines - cytosine (C) et uracile (U). Ces quatre bases produisent 64 combinaisons différentes (4 3 ) de trois codons de base, comme le montre le tableau 4.1. La séquence nucléotidique du codon sur l'ARNm est écrite de l'extrémité 5 & 8242 à l'extrémité 3 & 8242. Soixante et un codons codent pour les 20 acides aminés présents dans les protéines.

Les trois codons UAA, UAG et UGA ne codent pas pour les acides aminés. Ils agissent comme des signaux d'arrêt dans la synthèse des protéines. Ces trois codons sont collectivement appelés codons de terminaison ou codons non-sens. Les codons UAG, UAA et UGA sont souvent appelés respectivement codons ambre, ocre et opale.

Les codons AUG - et parfois GUG - sont les codons initiateurs de la chaîne.

Autres caractéristiques du code génétique:

Le code génétique est universel, spécifique, non chevauchant et dégénéré.

Les mêmes codons sont utilisés pour coder les mêmes acides aminés dans tous les organismes vivants. Ainsi, le code génétique a été conservé au cours de l'évolution. Par conséquent, le code génétique est à juste titre considéré comme universel. Il existe cependant quelques exceptions. Par exemple, AUA est le codon de la méthionine dans les mitochondries. Le même codon (AUA) code pour l'isoleucine dans le cytoplasme. À quelques exceptions près, le code génétique est universel.

Un codon particulier code toujours pour le même acide aminé, d'où le code génétique est hautement spécifique ou sans ambiguïté, par ex. UGG est le codon du tryptophane.

Le code génétique est lu à partir d'un point fixe sous la forme d'une séquence de bases continue. Il est sans chevauchement, sans virgule et sans aucune ponctuation. Par exemple, UUUCUUACAGGG est lu comme UUU/CUU/AGA/GGG. L'ajout ou la suppression d'une ou deux bases modifiera radicalement la séquence du message dans l'ARNm. Et la protéine synthétisée à partir d'un tel ARNm sera totalement différente. Ceci est rencontré dans les mutations de décalage de cadre qui provoquent une altération du cadre de lecture de l'ARNm.

La plupart des acides aminés ont plus d'un codon. Le codon est dégénéré ou redondant, puisqu'il existe 61 codons disponibles pour coder pour seulement 20 acides aminés. Par exemple, la glycine a quatre codons. Les codons qui désignent le même acide aminé sont appelés synonymes. La plupart des synonymes ne diffèrent que par la troisième base (3 & 8242) du codon. L'hypothèse de Wobble explique la dégénérescence des codons.

Reconnaissance Codon-Anticodon:

Le codon de l'ARNm est reconnu par l'anticodon de l'ARNt (Fig. 4.14). Ils s'apparient dans le sens antiparallèle (5′ → 3′ d'ARNm avec 3′ → 5′ d'ARNt). L'appariement conventionnel habituel des bases complémentaires (A = U, C = G) se produit entre les deux premières bases du codon et les deux dernières bases de l'anticodon. La troisième base du codon est plutôt clémente ou flexible par rapport à la base complémentaire. La région anticodon de l'ARNt se compose de sept nucléotides et reconnaît le codon à trois lettres dans l'ARNm.

Hypothèse d'oscillation:

L'hypothèse Wobble, avancée par Crick, est le phénomène dans lequel un seul ARNt peut reconnaître plus d'un codon. Cela est dû au fait que la troisième base (3′-base) dans le codon ne parvient souvent pas à reconnaître la base complémentaire spécifique dans l'anticodon (5′-base).L'oscillation est attribuée à la différence dans l'arrangement spatial de l'extrémité 5 de l'anticodon. L'appariement possible de la base à 5 extrémité de l'anticodon (de l'ARNt) avec la base à 3 extrémité du codon (ARNm) est donné

L'hypothèse de Wobble explique la dégénérescence du code génétique, c'est-à-dire l'existence de plusieurs codons pour un seul acide aminé. Bien qu'il existe 61 codons pour les acides aminés, le nombre d'ARNt est bien moindre (environ 40) ce qui est dû à l'oscillation.

Mutations et code génétique:

Les mutations entraînent le changement de séquences nucléotidiques dans l'ADN, et par conséquent dans l'ARN. L'effet ultime des mutations est sur la traduction à travers les altérations des codons. Certaines mutations sont nocives.

La survenue de la drépanocytose due à une altération d'une seule base (CTC → CAC dans l'ADN, et GAG → GUG dans l'ARN) est un exemple classique de la gravité des mutations. Le résultat est que le glutamate à la 6ème position de la chaîne β de l'hémoglobine est remplacé par la valine. Cela se produit puisque le codon GUG modifié de l'ARNm code pour la valine au lieu du glutamate (codé par GAG chez les personnes normales).

Les mutations par décalage de cadre sont causées par la suppression ou l'insertion de nucléotides dans l'ADN qui génère des ARNm altérés. Comme le cadre de lecture de l'ARNm est continu, les codons sont lus en continu et des acides aminés sont ajoutés. Cela se traduit par des protéines qui peuvent contenir plusieurs acides aminés altérés, ou parfois la synthèse des protéines peut être interrompue prématurément.

Protéine Ciblage :

Les protéines eucaryotes (des dizaines de milliers) sont réparties entre le cytosol, la membrane plasmique et de nombreux organites cellulaires (noyau, mitochondries, réticulum endoplasmique...). Aux endroits appropriés, ils exercent leurs fonctions.

Les protéines, synthétisées en traduction, doivent atteindre leur destination pour manifester leur activité biologique. Ceci est effectué par un processus appelé ciblage des protéines ou tri des protéines ou localisation des protéines. Les protéines se déplacent d'un compartiment à l'autre par de multiples mécanismes.

Le transport des protéines du réticulum endoplasmique à travers l'appareil de Golgi et au-delà utilise des vésicules porteuses. On peut cependant noter que seules les protéines correctement repliées sont reconnues comme la cargaison pour le transport. Le ciblage des protéines et les modifications post-traductionnelles se produisent de manière coordonnée.

Certaines glycoprotéines sont ciblées pour atteindre les lysosomes, car les protéines lysosomales peuvent reconnaître les composés glycosidiques, par ex. Phosphate de N-acétyl-glucosamine. Pour le transport des protéines sécrétoires, un mécanisme spécial est à l'œuvre. Un peptide signal contenant 15-35 acides aminés, situé à l'extrémité amino-terminale des protéines sécrétoires facilite le transport.

Ciblage des protéines vers les mitochondries:

La plupart des protéines des mitochondries sont synthétisées dans le cytosol et leur transport vers les mitochondries est un processus complexe. La majorité des protéines sont synthétisées sous forme de pré-protéines plus grandes avec des pré-séquences N-terminales pour l'entrée de ces protéines dans les mitochondries. Le transport des protéines dépliées est souvent facilité par des chaperons.

Une protéine, à savoir le signal de ciblage de la matrice mitochondriale, impliquée dans le ciblage des protéines, a été identifiée. Cette protéine peut reconnaître le récepteur mitochondrial et transporter certaines protéines du cytosol vers les mitochondries. Il s'agit d'un processus dépendant de l'énergie.

Ciblage des protéines vers d'autres organites:

Des signaux spécifiques pour le transport des protéines vers les organites tels que les noyaux et les peroxysomes ont été identifiés. Les protéines plus petites peuvent facilement traverser les pores nucléaires. Cependant, pour les protéines plus grosses, des signaux de localisation nucléaire sont nécessaires pour faciliter leur entrée dans le noyau.

ADN mitochondrial, transcription et traduction:

L'ADN mitochondrial (ADNmt) a des ressemblances structurelles et fonctionnelles avec l'ADN procaryote. Ce fait soutient le point de vue selon lequel les mito­chondries sont des dérivés de procaryotes. L'ADNmt est de nature circulaire et contient environ 16 000 bases nucléotidiques.

Une grande majorité des protéines structurelles et fonctionnelles des mitochondries sont synthétisées dans le cytosol, sous l'influence de l'ADN nucléaire. Cependant, certaines protéines (environ 13), dont la plupart sont des composants de la chaîne de transport d'électrons, sont synthétisées dans les mitochondries. La transcription a lieu dans les mitochondries conduisant à la synthèse d'ARNm, d'ARNt et d'ARNr. Deux types d'ARNr et environ 22 espèces d'ARNt ont été identifiés à ce jour. Ceci est suivi d'une traduction aboutissant à la synthèse des protéines.

Les mitochondries du spermatozoïde n'entrent pas dans l'ovule pendant la fécondation, l'ADNmt est donc hérité de la mère. L'ADN mitochondrial est soumis à un taux élevé de mutations (environ 10 fois plus que l'ADN nucléaire) qui provoque des défauts héréditaires de phosphorylation oxydative. Les plus connues d'entre elles sont certaines myopathies mitochondriales et la neuropathie optique héréditaire de Leber.

Ce dernier se trouve principalement chez les hommes et se caractérise par une cécité due à une perte de la vision centrale à la suite d'une dégénérescence neurorétinienne. La neuropathie optique héréditaire de Leber est une conséquence de la mutation d'une seule base dans l'ADNmt. Pour cette raison, l'acide aminé histidine, à la place de l'arginine, est incorporé dans l'enzyme NADH coenzyme Q réductase.


Voir la vidéo: Virology Lectures 2020 #6: RNA directed RNA synthesis (Août 2022).