Informations

Pourquoi les bactéries utilisent-elles la méthionine formylée dans l'ARNt initiateur, alors que les eucaryotes ne le font pas ?

Pourquoi les bactéries utilisent-elles la méthionine formylée dans l'ARNt initiateur, alors que les eucaryotes ne le font pas ?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Quelqu'un pourrait-il suggérer une explication à l'évolution de ce trait chez les bactéries? Cela confère-t-il un avantage ?

Elle est également exploitée par les récepteurs immunitaires de certains eucaryotes pour la reconnaissance des bactéries.

Dans la littérature, je n'ai pu trouver qu'un article suggérant un rôle possible dans la signalisation de la dégradation des protéines.


Sommaire

La question est posée en des termes qui impliquent que la formylation de la méthionine initiatrice (Met) de la synthèse des protéines était un développement évolutif relativement tardif pour un but non concerné par la traduction, comme permettre la régulation de la dégradation des protéines.

Ma réponse adopte le point de vue tout à fait différent qu'il s'agissait d'un développement évolutif précoce de la traduction, apparaissant dans le cadre du système d'initiation à un codon spécifique - AUG. Avec le temps, le système d'initiation est devenu plus sophistiqué, la spécificité de l'initiation résidant davantage dans un ARNt d'initiation distinct acceptant Met.F qui a évolué pour avoir une structure distincte de l'allongement de l'ARNt acceptant Metm ce qui permet de le distinguer de ce dernier et des autres ARNt allongeurs.

Je postule que dans la lignée menant aux eucaryotes et aux archées, une mutation s'est ensuite produite qui a entraîné une perte de capacité à former l'ARNt MetF, mais que les individus porteurs de cette mutation étaient viables car l'initiation avait cessé de dépendre de la formylation pour la discrimination.

Systèmes contemporains d'initiation à la traduction

J'ai construit le diagramme ci-dessous pour une réponse à une autre question, mais il montre certaines des caractéristiques communes de l'initiation de la synthèse des protéines chez les eucaryotes et les procaryotes contemporains. (Le lecteur qui souhaite plus de détails sur la traduction est dirigé vers les manuels standard, par exemple le chapitre 29 de Berg et al.)

Les commun les caractéristiques de l'initiation chez les eucaryotes et les procaryotes sont :
1. L'utilisation d'un ARNt acceptant Met avec un anticodon qui reconnaît AUG pour insérer le premier acide aminé dans une protéine.
2. Que cet ARNt, ici désigné ARNtF (mais aussi désigné ARNtje) est distinct de l'ARNt acceptant Met utilisé pour insérer Met à d'autres points de la protéine pendant l'élongation.
3. Que le (f)Met-ARNtF est reconnu par un facteur de liaison à l'ARNt d'initiation (I-TBF dans le schéma - une abréviation non standard) et non par le facteur de liaison à l'ARNt d'allongement (E-TBF dans le schéma).
4. Que le (f)Met-ARNtF est délivré au site P du ribosome (autrement occupé par le peptidyl-ARNt en croissance), plutôt qu'au site A, auquel les elongateurs-ARNt sont liés.
5. Dans de nombreux cas, le N-terminal Met est éliminé par protéolyse après traduction.

Les caractéristiques de l'initiation qui différer entre les eucaryotes et les procaryotes sont :
1. Que l'acide aminé initiateur dans les eubactéries, les mitochondries et les chloroplastes est N-formyl-méthionine (fMet), plutôt que la méthionine, comme c'est le cas chez les eucaryotes et les archées.
2. La sélection du codon AUG particulier pour l'initiation est différente dans les deux cas. Chez les eubactéries et les archées, l'ARNr 16S se lie à une séquence polypurine, Shine et Dalgarno ; chez les eucaryotes, la méthode normale implique un complexe de la petite sous-unité ribosomique et le « balayage » du Met-ARNt à partir de l'extrémité 5' de l'ARNm (dont la structure secondaire est d'abord déroulée.

Argument

Comme la question de la fonction de la formylation se pose en termes évolutifs, et que le fMet-ARNt est impliqué dans l'initiation de la synthèse protéique, il semble valable de considérer l'évolution de ce dernier processus, aussi spéculative soit-elle inévitablement. La formulation suivante est la mienne, bien que je soupçonne qu'elle représente l'orthodoxie dans ce domaine. Ceci, bien sûr, fait ne pas signifie qu'il est nécessairement correct.

  1. Il semble probable qu'initialement la traduction manquait de signaux de démarrage et d'arrêt (et probablement aussi de facteurs d'initiation des protéines). Je ne traiterai pas de la terminaison, sauf pour dire que c'est probablement un problème plus facile, mais l'initiation semblerait nécessiter l'introduction de deux nouvelles fonctionnalités :
    (i) La désignation d'un codon d'initiation spécifique AUG†, qui, pour une raison quelconque, correspondait à l'un des acides aminés existants, la méthionine.
    (ii) Étant donné que ce codon d'initiation a également servi à l'incorporation de Met en interne, le développement d'un système pour sélectionner un AUG particulier pour l'initiation. Il semble plus simple de supposer que (i) a précédé (ii), et c'est ce que je supposerai, bien que les arguments suivants n'en dépendent pas.

  2. Dans l'initiation contemporaine, le problème de la compétition entre les facteurs d'initiation et d'élongation pour les (f)Met-ARNt a été résolu par l'évolution de deux ARNt distincts qui acceptent Met - l'un pour l'initiation et l'autre pour l'élongation. Ceux-ci partagent certaines caractéristiques structurelles - leur aminoacylation est catalysée par la même amino-acyl-ARNt synthétase - mais ils diffèrent par leur reconnaissance par les facteurs de synthèse protéique qui les amènent au site P ou A approprié sur le ribosome. Malgré l'absence de formylation du Met-ARNtF chez les eucaryotes, la similitude structurelle avec l'ARNt eubactérienF est tel qu'il peut être méthylé par E. coli transformylase (examiné ici). Cependant, j'imagine que cet ARNt structurellement différent a mis du temps à évoluer, de même que les facteurs de synthèse des protéines.

Mon argument est que la formylation du Met-ARNt était la base de la discrimination initiale entre les Met-ARNt initiateurs et allongeurs, et cela aurait pu survenir avant même la duplication du gène qui a conduit à la séparation des ARNt.

  1. Pourquoi le fMet-ARNt se lierait-il préférentiellement au site P et le Met-ARNt au site A ? Les ARNt amino acyl qui se lient au site A ont tous un groupe α-amino libre qui attaque la liaison du peptide à l'ARNt dans l'ARNt peptidyl dans le site A au centre de la peptidyl transférase. Le peptidyl-ARNt, bien sûr, manque d'un tel groupe α-amino libre. À cet égard, le fMet-ARNt, avec un groupe α-amino bloqué, ressemble au peptidyl-ARNt (voir schéma ci-dessous). On peut imaginer comment des différences structurelles dans le site P pourraient entraver la liaison du Met-ARNt, mais permettre la liaison du fMet-ARNt. Et, bien sûr, le fMet-ARNt ne serait pas capable de réagir s'il était lié au site A, qui pourrait également avoir des caractéristiques structurelles pour entraver sa liaison.

  1. Si par la suite la discrimination est amplifiée par la duplication de gènes et l'évolution d'un ARNt structurellement distinctF, le besoin de formylation serait diminué, et on pourrait envisager que sa perte ultérieure chez les eucaryotes n'ait eu aucun effet indésirable ou soit facile à accommoder.

  2. La question se pose de savoir pourquoi la formylation a persisté dans les eubactéries, même s'il est possible d'obtenir des mutants viables dépourvus de la transformylase. C'est à cela que le travail fait allusion dans la question aborde. Il y a un article de 2015 de Piatkov et al. ce qui suggère que N-terminal fMet peut être un système de dégradation dans E. coli. Vraisemblablement, cela est survenu après la divergence de la lignée menant aux eucaryotes et aux archées, qui ont développé d'autres systèmes pour réguler le renouvellement des protéines.

  3. Cependant, je suggérerais que, en supposant que ce qui précède soit correct, cela explique la persistance de la formylation de Met dans les eubactéries, et non la raison de son apparition initiale.

Remarques finales

A présent je connais non des preuves convaincantes qui prouvent mes arguments et rejettent l'idée de la protéolyse concernant la raison de l'évolution du fMet-ARNt. C'est le problème avec les idées sur l'évolution précoce. Il est aggravé ici par le fait que la suggestion d'un rôle dans la protéolyse n'est apparue que récemment et que ce n'est plus le domaine « chaud » qu'il était il y a 50 ans.

Néanmoins, j'ai du mal à imaginer un système aussi crucial et sensible que la synthèse des protéines incorporant une caractéristique comme la formylation de la méthionine si elle n'avait qu'une fonction secondaire. Dans ce cas, il semblerait plus facile de formuler le N-terminaux des protéines en post-traduction, comme pour les autres N-modifications terminales comme l'acétylation. De plus, la découverte que les mitochondries dérivées d'eubactéries utilisent toujours la fMet peut difficilement contrôler le renouvellement des protéines, car la grande majorité des protéines mitochondriales sont traduites dans le cytoplasme et manquent de fMet.

†Note de bas de page

Je suis conscient que, chez les bactéries en particulier, il existe d'autres codons d'initiation possibles, notamment GUG, bien que l'acide aminé initiateur soit toujours (f)Met. (Cela atteste de l'importance de la structure de l'ARNt dans l'initiation contemporaine.) Il est plus simple de se référer à AUG dans l'argument.


Initiation de la synthèse des protéines

  • l'ARNm à traduire
  • les deux sous-unités ribosomiques (petites et grandes sous-unités)
  • l'aminoacyl-ARNt qui est spécifié par le premier codon de l'ARNm (GTP), qui fournit de l'énergie pour le processus et les eucaryotes ont également besoin d'adénosine triphosphate !
  • facteurs d'initiation qui permettent l'assemblage de ce complexe d'initiation - les procaryotes ont 3 facteurs d'initiation connus (IF-1, IF-2 et IF-3), tandis que les eucaryotes ont plus de dix facteurs désignés par le préfixe eIF.
  1. Séquence Shine-Dalgarno (SD) - Chez Escherichia coli, on observe une séquence avec un pourcentage élevé de bases nucléotidiques puriques, connue sous le nom de séquence Shine-Dalgarno. Cette région est située près de l'extrémité 5 & rsquo de la molécule d'ARNm, 6 à 10 bases en amont du codon initiateur. Le composant ARNr 16S de la petite sous-unité ribosomique possède une séquence complémentaire de la séquence SD près de son extrémité 3&rsquo. Ainsi les deux séquences complémentaires peuvent se coupler, ce qui facilite le positionnement de la sous-unité ribosomique 30S sur l'ARNm à proximité du codon d'initiation. Le mécanisme est légèrement différent chez les eucaryotes car ils n'ont pas de séquences SD. Chez les eucaryotes, avec l'aide des facteurs d'initiation eIF-4, la sous-unité ribosomique 40S se lie à proximité d'une structure appelée "structure ldquocap" à l'extrémité 5 de l'ARNm, puis descend la séquence d'ARN messager jusqu'à ce qu'elle trouve le codon initiateur. Cependant, ce processus nécessite de l'énergie de l'ATP.
  2. Codon initiateur (AUG) - Le triplet AUG initiateur est reconnu par un ARNt initiateur spécial. Chez les procaryotes, cet événement est facilité par IF-2-GTP, tandis que chez les eucaryotes par eIF-2-GTP et des eIF supplémentaires. L'ARN de transport initiateur chargé s'approche du site P sur la petite sous-unité ribosomique. Dans les bactéries (et dans les mitochondries), une méthionine est attachée à l'ARNt initiateur, puis un groupe formyle est ajouté par l'enzyme transformylase, qui utilise le tétrahydrofolate de N10-formyle comme donneur de carbone et enfin une méthionine N-formylée est attachée à l'initiateur ARNt. A titre de comparaison, chez les eucaryotes, l'ARN de transport initiateur attache une méthionine non formylée. Dans les deux types de cellules, cette méthionine N-terminale attachée à l'extrémité 5&rsquo est éliminée avant la fin de la traduction. Dans la dernière étape de l'initiation, la grande sous-unité ribosomique rejoint le complexe formé à présent, et ainsi un ribosome entièrement fonctionnel est formé. Ce complexe a un ARNt initiateur chargé dans le site P et le site A vide. Au cours de cette étape de synthèse des protéines, l'énergie du GTP est utilisée sur (e)IF-2, qui est hydrolysée en GDP. La réactivation de (e)IF-2-GDP est facilitée par un facteur d'échange de nucléotides guanine.

Biochimie. 5e édition.

Le plan de base de la synthèse des protéines chez les eucaryotes et les archées est similaire à celui des bactéries. Les grands thèmes structurels et mécanistes reviennent dans tous les domaines de la vie. Cependant, la synthèse des protéines eucaryotes implique plus de composants protéiques que la synthèse des protéines procaryotes, et certaines étapes sont plus complexes. Certaines similitudes et différences notables sont les suivantes :

Ribosomes. Les ribosomes eucaryotes sont plus gros. Ils se composent d'une grande sous-unité 60S et d'une petite sous-unité 40S, qui se réunissent pour former une particule 80S ayant une masse de 4200 kd, contre 2700 kd pour le ribosome procaryote 70S. La sous-unité 40S contient un ARN 18S homologue à l'ARN procaryote 16S. La sous-unité 60S contient trois ARN : les ARN 5S et 28S sont les homologues des molécules procaryotes 5S et 23S, son ARN 5.8S est unique aux eucaryotes.

ARNt initiateur. Chez les eucaryotes, l'acide aminé initiateur est la méthionine plutôt que N-formylméthionine. Cependant, comme chez les procaryotes, un ARNt spécial participe à l'initiation. Cet aminoacyl-ARNt est appelé Met-ARNtje ou Met-ARNtF (l'indice “i” représente l'initiation, et 𠇏” indique qu'il peut être formylé in vitro).

Initiation. Le codon initiateur chez les eucaryotes est toujours AUG. Les eucaryotes, contrairement aux procaryotes, n'utilisent pas de séquence spécifique riche en purines du côté 5 & 02032 pour distinguer les AUG initiateurs des AUG internes. Au lieu de cela, l'AUG le plus proche de l'extrémité 5′ de l'ARNm est généralement sélectionné comme site de départ. Un ribosome 40S s'attache au capuchon à l'extrémité 5′ de l'ARNm eucaryote (section 28.3.1) et recherche un codon AUG en se déplaçant étape par étape dans la direction 3′ (Figure 29.33). Ce processus de balayage dans la synthèse des protéines eucaryotes est alimenté par des hélicases qui hydrolysent l'ATP. Appariement de l'anticodon du Met-ARNtje avec le codon AUG de l'ARNm signale que la cible a été trouvée. Dans presque tous les cas, l'ARNm eucaryote n'a qu'un seul site de départ et est donc la matrice d'une seule protéine. En revanche, un ARNm procaryote peut avoir plusieurs séquences Shine-Dalgarno et, par conséquent, des sites de départ, et il peut servir de matrice pour la synthèse de plusieurs protéines. Les eucaryotes utilisent beaucoup plus de facteurs d'initiation que les procaryotes, et leur interaction est beaucoup plus complexe. Le préfixe eIF désigne un facteur d'initiation eucaryote. Par exemple, eIF-4E est une protéine qui se lie directement à la coiffe 7-méthylguanosine (section 28.3.1), tandis que eIF-4A est une hélicase. La différence de mécanisme d'initiation entre les procaryotes et les eucaryotes est, en partie, une conséquence de la différence de traitement de l'ARN. L'extrémité 5&# de l'ARNm est facilement disponible pour les ribosomes immédiatement après la transcription chez les procaryotes. En revanche, le pré-ARNm doit être traité et transporté vers le cytoplasme chez les eucaryotes avant que la traduction ne soit initiée. Ainsi, il existe de nombreuses opportunités pour la formation de structures secondaires complexes qui doivent être éliminées pour exposer les signaux dans l'ARNm mature. Le capuchon 5′ fournit un point de départ facilement reconnaissable. De plus, la complexité de l'initiation de la traduction eucaryote fournit un autre mécanisme d'expression génique que nous explorerons plus en détail au chapitre 31.

Allongement et terminaison. Les facteurs d'élongation eucaryotes EF1α et EF1βγ sont les homologues des EF-Tu et EF-T procaryotes. La forme GTP de EF1α fournit l'aminoacyl-ARNt au site A du ribosome, et EF1βγ catalyse l'échange de GTP contre le GDP lié. L'EF2 eucaryote médie la translocation induite par le GTP de la même manière que l'EF-G procaryote. La terminaison chez les eucaryotes est réalisée par un seul facteur de libération, eRF1, contre deux chez les procaryotes. Enfin, eIF3, comme son homologue procaryote IF3, empêche la réassociation des sous-unités ribosomiques en l'absence d'un complexe d'initiation.

Figure 29.33

Initiation à la traduction eucaryote. Chez les eucaryotes, l'initiation de la traduction commence par l'assemblage d'un complexe sur le capuchon 5′ qui comprend la sous-unité 40S et Met-ARNtje. Poussé par l'hydrolyse de l'ATP, ce complexe scanne l'ARNm jusqu'au premier AUG (suite. )


Résultats

Réannotation fonctionnelle de gènes bactériens dans tRNAdb-CE v.8

La base de données tRNAdb-CE v0.8 contient 132 129 enregistrements de gènes procaryotes au total, dont 129 989 enregistrements de gènes sont bactériens. Parmi les séquences bactériennes, 9 917 contiennent une matrice pour anticodon avec la séquence CAU. Pour une fraction substantielle de ses enregistrements, la base de données tRNAdb-CE v0.8 utilise TFAM 1.4 pour la classification fonctionnelle des gènes d'ARNt bactériens (comme décrit dans http://trna.ie.niigata-u.ac.jp/trnadb/method. html). Cependant, le modèle protéobactérien de l'ARNt Ile CAU La classe d'allongeurs fournie avec TFAM 1.4 ne se généralise pas bien à tous les embranchements bactériens [13]. Par conséquent, nous avons réannoté les 9 917 gènes bactériens des ARNt avec des anticodons CAU dans tRNAdb-CE v0.8 en utilisant le modèle Silva TFAM plus général dérivé de l'analyse de Silva et al. [12]. Ce modèle est également fourni en tant que données supplémentaires dans le présent travail. En appliquant le modèle Silva TFAM à 9 917 gènes d'ARNt contenant des anticodons CAU bactériens, nous avons révisé les annotations fonctionnelles de 62 des 3 918 gènes précédemment annotés (1,58 %) et a fourni de nouvelles annotations pour 5 999 gènes supplémentaires qui n'étaient pas spécifiés auparavant (60,4%). Les fréquences de reclassification sont présentées dans le tableau # x000a0 1 , montrant qu'aucun gène précédemment classé n'a été réannoté en tant que gènes d'ARNt fMet initiateurs et que nos efforts de réannotation ont abouti à des fréquences approximativement égales des deux classes de gènes d'ARNt allongeurs. Ces données réannotées sont également fournies dans les fichiers supplémentaires 1 et 2.

Tableau 1

Réannotation des ARNt bactériens avec des anticodons CAU dans tRNAdb-CE v.8 à l'aide d'un modèle personnalisé basé sur l'analyse de Silva et al. [12]. “kIle” signifie allongeurs d'ARNt isoleucine avec anticodon CAU. “. ” signifie qu'aucune annotation spécifique n'a été fournie dans tRNAdb-CE v.8

RencontréInikileSomme
AnnotationsRencontré10550511106
Dans tRNAdb-CEIni0182401824
v.8kile110977988
. 1696261416895999
Somme2762443827179917

Réannotation structurelle de gènes bactériens dans tRNAdb-CE v.8

Une caractéristique bien conçue du modèle de données tRNAdb-CE v0.8 réside dans le fait que ses enregistrements de gènes contiennent non seulement des séquences de gènes annotées, mais également dix bases de contexte génomique à la fois en amont et en aval. L'inspection des données de l'ARNtdb-CE v0.8 a révélé plusieurs gènes avec une séquence à 3 extrémités annotée autre que CCA, suivis de séquences à 3 extrémités qui commencent par la séquence CCA. Pour évaluer avec confiance si ces gènes pourraient modéliser une extrémité 3′-CCA pour leurs produits géniques, nous avons attribué des coordonnées Sprinzl [4] à ces bases pour chaque séquence de gène. Ces coordonnées n'ont pas été fournies dans tRNAdb-CE v0.8. Pour ce faire, nous avons mis en œuvre un algorithme de programmation dynamique pour optimiser l'appariement des bases de la région de l'accepteur 3′-end par rapport à la base de données annotée 5′-end. Notre algorithme de programmation dynamique avec des paramètres donnés dans des méthodes (qui ont été choisies de manière quelque peu arbitraire et non optimisée) a presque toujours annoté les tiges accepteurs de manière identique à celles données dans la base de données. De plus, nous n'avons jamais utilisé notre algorithme pour réannoter les tiges acceptrices, uniquement pour attribuer en toute confiance et de manière cohérente les coordonnées Sprinzl à la région 3 & 02032 de chaque gène. En utilisant cette technique, nous avons annoté 2 866 gènes d'ARNt bactériens supplémentaires sur 129 989 (ou 2,2%) enregistrements comme contenant la matrice CCA à l'extrémité 3 & x02032 dans le cadre de séquence des coordonnées Sprinzl 74-76.

Pour clarifier pourquoi nous avons pu identifier 2 866 gènes d'ARNt supplémentaires dans tRNAdb-CE v0.8 ce modèle CCA, nous avons exécuté des programmes de recherche de gènes d'ARNt sur les enregistrements de la base de données, soupçonnant que peut-être une erreur de l'utilisateur avec les chercheurs de gènes d'ARNt pourrait avoir causé ces annotations erronées. Nous avons utilisé ARAGORN v1.0 [17] et tRNAscan-SE v.1.23 [18] en mode de recherche de gènes d'ARNt eucaryote par défaut, et tRNAscan-SE v.1.23 en mode bactérien (avec l'option -B). Nous avons constaté que tRNAscan-SE v.1.23, lorsqu'il est exécuté dans son mode de recherche de gènes eucaryote par défaut, n'annote jamais les nucléotides aux positions 74-76, quelle que soit leur séquence. Une exception à cette règle était avec les gènes d'ARNt de sélénocystéine, pour lesquels tRNAscan-SE en mode eucaryote annote les positions 74� s'ils contiennent la séquence CCA. À partir de ces observations, nous concluons qu'une cause probable des erreurs d'annotation dans tRNAdb-CE est l'erreur de l'utilisateur dans les pipelines d'annotation du génome. Ceci est particulièrement notable lorsque les utilisateurs de tRNAscan-SE appliquent son mode de recherche de gènes eucaryotes par défaut sur les génomes procaryotes. De telles erreurs peuvent alors se propager sans cesse dans les bases de données publiques et privées.

Fréquences de la modélisation CCA dans les gènes ARNt bactériens

Avec nos données ARNtdb-CE réannotées en main, nous avons calculé les fréquences de modélisation CCA dans les gènes d'ARNt à travers différentes classes fonctionnelles d'ARNt et groupements taxonomiques tels que définis par la taxonomie NCBI [19]. La figure  1 montre nos données résumées par genre procaryote. Les clades procaryotes présentent les quatre modèles possibles : 1) la plupart ou la totalité des gènes d'ARNt matrice CCA, 2) peu ou pas de matrice de gènes d'ARNt CCA, 3) principalement la matrice de gènes initiateurs CCA, ou — le plus rarement — 4) principalement l'ARNt d'allongement modèle de gènes CCA.

Fréquences résumées auxquelles les gènes d'ARNt d'allongement et les gènes d'ARNt d'initiateur modèlent 3’-CCA par rapport à la taille moyenne du génome dans différents genres procaryotes. NCBI-Taxonomy - cladogramme basé sur les genres procaryotes dans tRNAdb-CE v.8 montrant la taille moyenne du génome (barres radiales bleu clair) et les fractions moyennes auxquelles le modèle de gènes d'ARNt d'allongement 3’-CCA (cercles bleus) et le modèle de gènes d'ARNt initiateur 3& #x02019-CCA (cercles rouges)

Les cinq embranchements les mieux échantillonnés dans notre ensemble de données, tels que définis par le nombre de genres distincts avec au moins un génome séquencé, sont Proteobacteria, Bacillus/Clostridium, Actinobacteria, Bacteroidetes/Clorobi et Cyanobacteria. Ces cinq phylums présentent trois des quatre modèles décrits ci-dessus dans un modèle étonnamment cohérent par phylum. Pratiquement tous les gènes ARNt matrice CCA dans Proteobacteria et Bacillus/Clostridium, sauf dans certains génomes réduits, dont la plupart matrice CCA uniquement dans les gènes ARNt initiateurs, ou dans aucun gène ARNt du tout. Dans les cyanobactéries et les actinobactéries, en revanche, seuls les gènes initiateurs de l'ARNt matrice CCA, à quelques exceptions près. Par exemple, un clade d'Actinobactéries avec des génomes relativement petits existe dans lequel les gènes d'ARNt initiateurs et élongateurs modèlent le CCA à des fréquences élevées. Dans le groupe Bacteroidetes/Chlorobi, la plupart des gènes d'ARNt ne modèlent pas le CCA, à l'exception d'une lignée, les Solitalea, dans laquelle seuls les gènes d'ARNt initiateurs modèlent le CCA. Dans les cinq embranchements les plus échantillonnés, il existe à la fois des génomes de taille petite et moyenne dans lesquels seuls les gènes d'ARNt initiateurs matrice CCA, ou aucun gène d'ARNt à toutes les matrices CCA. Certains Myxococcales, parmi les Deltaprotéobactéries, sont exceptionnels en ayant parmi les plus gros génomes que nous ayons observés et pourtant aucun gène ARNt ou seulement des gènes ARNt initiateurs matrice CCA.

Les phylums moins échantillonnés sont également assez hétérogènes dans notre ensemble de données. Dans les Thermotogae, Deinococcus/Thermus et Tenericutes, tous les gènes d'ARNt modèlent le CCA. Les Spirochaetae ne modèlent le CCA dans aucun gène, tandis que chez Deferribacteres, seuls les gènes de l'ARNt initiateur modèlent le CCA. Dans le modèle le plus rare que nous avons observé, dans seulement quelques genres d'archées ou de bactéries, principalement des gènes d'ARNt élongateurs et non des gènes d'ARNt initiateurs matrice CCA.

Afin de mieux visualiser ces données jusqu'aux génomes individuels et de séparer les différentes classes d'allongeurs, nous avons créé un navigateur taxonomique interactif basé sur javascript pour nos résultats visualisés avec des cartes thermiques dans n'importe quel navigateur Web ordinaire. Le navigateur de données interactif complet est disponible sous forme de fichiers supplémentaires 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 et 13 pour ce travail. Une vue statique de ces données est également fournie sous forme de PDF interrogeable dans les fichiers supplémentaires 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 et 14. La figure  2 présente un instantané de ce navigateur avec des résultats détaillés notables pour les gènes ARNt bactériens. La figure montre des colonnes de données de fréquence, correspondant aux classes fonctionnelles de gènes d'ARNt, triées de gauche à droite par fréquence moyenne décroissante à laquelle les gènes d'ARNt modèlent le CCA sur toutes les séquences génomiques procaryotes de notre échantillon. Cette analyse révèle que, chez les bactéries et les archées, les gènes d'ARNt initiateurs (étiquetés Ini) matricent le CCA à la fréquence la plus élevée (74,1 %), contre 66,2 % pour les gènes d'ARNt élongateurs en général. Dans les bactéries, les gènes d'ARNt initiateurs modèlent le CCA à une fréquence de 74,7%, juste derrière les gènes d'ARNt de sélénocystéinyle (ARNt Sec, Sec = selenocysteine), avec une fréquence de 89,2%. Nous avons également constaté que les gènes de l'ARNt Asp et de l'ARNt Asn matrice CCA présentaient les fréquences les plus élevées parmi tous les gènes d'ARNt d'élongateurs canoniques. Ci-dessous, nous décrivons certains des résultats notables illustrés à la Fig.  2 .

Données résumées sur la taille du génome et la fréquence de l'ACC dans les clades bactériens ventilés par classe fonctionnelle d'ARNt. À l'exception des colonnes intitulées 𠇊ll,” “SeC,” et “Pyl,”, toutes les colonnes de données de fréquence sont triées par ordre décroissant de gauche à droite selon la fréquence à laquelle les classes de gènes d'ARNt modèlent CCA sur tous les génomes procaryotes que nous avons échantillonnés. Les clades sont définis comme dans la taxonomie NCBI. Les étiquettes de colonne correspondent à l'identité de charge d'acides aminés à trois lettres de l'IUPAC, à l'exception de “Ini” (initiateurs) et “xIle” (isoaccepteurs d'isoleucine à lecture de codon AUA). 𠇊ll” résume les données de fréquence sur toutes les classes d'ARNt

Cyanobactéries

Parmi les embranchements bactériens que nous avons observés, les cyanobactéries présentent le modèle le plus frappant et le plus cohérent dans lequel spécifiquement les gènes d'ARNt initiateurs et non élongateurs modèlent le CCA. Les fréquences globales sont de 64,1% pour les gènes d'ARNt initiateurs contre 25,7% pour la prochaine classe de gènes la plus élevée, qui sont les gènes d'ARNt Tyr d'allongement. Mais différentes lignées de cyanobactéries présentent des variations considérables dans ce trait. Par exemple, parmi les génomes de Prochlorales et Nostocales comprenant à la fois les tailles moyennes de génomes les plus petites et les plus grandes, respectivement, les fréquences auxquelles les gènes d'ARNt initiateurs modèle CCA sont de 91,7% et 88,9%, tandis que les gènes d'ARNt élongateurs modèle CCA à seulement 3,4 % et 8,2 % respectivement. Dans 11 sur 12 de Prochlorocoque génomes et 9 sur 13 Synéchocoque génomes, seuls les gènes d'ARNt initiateurs matrice CCA. Initiateur ARNt gènes matrice CCA à des fréquences très différentes dans les ordres sœurs Oscillatoriales et Chroococcales au sein de la sous-classe Oscillatoriophycideae : 87,5 et 43,8% respectivement.

Les cyanobactéries sont également inhabituelles en ce que différentes souches et groupes présentent des classes de gènes d'ARNt d'allongeurs spécifiques qui modèlent également le CCA à des fréquences intermédiaires (supérieures à 10 %) tandis que d'autres classes d'élongateurs modèlent le CCA à des fréquences inférieures (inférieures à 10 %). Habituellement, si dans n'importe quel génome le gène d'ARNt initiateur ou le gène matrice CCA, au moins une classe de gène ARNt allongeur matricera également la CCA à une fréquence intermédiaire. La classe de gènes d'allongement qui modèle le CCA de la manière la plus cohérente à travers le phylum est la classe de gènes ARNt Tyr. Dans Nostocales, les gènes ARNt Tyr modèlent le CCA à une fréquence de (41,7 %), tandis que les gènes élongateurs ARNt Asn et ARNt Gln modèlent également le CCA à une fréquence relative élevée (36,8 % et 23,7 %).

Protéobactéries

Tous les gènes d'ARNt protéobactériens modèlent généralement le CCA à des fréquences constamment élevées : 96,1 % dans l'ensemble (Fig.  2 ). Pourtant, les gènes d'ARNt initiateurs protéobactériens matrice CCA à 98,0%, significativement plus élevés que les allongeurs protéobactériens (g =�.039, d.f. = 1, p <6 par un G-test d'indépendance calculé dans R 3.3.1 en utilisant la fonction “G.test” dans le package “RVaideMemoire” version 0.9�). Un examen plus approfondi de la variation protéobactérienne (Fichier supplémentaire 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 et 14) révèle que bien que de nombreuses protéobactéries libres modèlent le CCA à des fréquences élevées , les protéobactéries endosymbiotiques γ et les protéobactéries α à génome réduit présentent des schémas similaires à ceux décrits ci-dessus pour les cyanobactéries à génome réduit. Dans ces cas, les gènes d'ARNt initiateurs semblent être la seule classe à matricer de manière cohérente le CCA, tandis que plusieurs classes d'allongeurs également matricent le CCA. Par exemple, dans la plupart Buchnera aphidicola génomes, environ huit ou neuf classes d'ARNt d'allongeurs supplémentaires modèlent le CCA à des fréquences intermédiaires à élevées, tandis que d'autres classes ne modèlent pas le CCA, comme indiqué précédemment [20]. Remarquablement, en tout Buchnera génomes de souche sauf un, les gènes d'ARNt initiateurs toujours matrice CCA. De plus, comme chez les Cyanobactéries, dans la plus petite des Buchnera génomes, seuls les gènes d'ARNt initiateurs matrice CCA. Ce même schéma est valable dans d'autres génomes de protéobactéries endosymbiotiques tels que Ca. Blochmannia, Wigglesworthia, Glossina, Californie. Baumannia, Californie. Carsonella, Californie. Portiera, ainsi que des endosymbiotes α-protéobactéries tels que Wolbachia. En revanche, parmi les plus petits génomes γ-protéobactériens comme Ca. Hodgkinie, aucun des gènes d'ARNt matrice CCA.

Autres embranchements bactériens

De nombreux genres et classes divers de bactéries modèlent préférentiellement le CCA dans leurs gènes d'ARNt initiateurs (Fichier supplémentaire 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 et 14). Les exemples comprennent Géobacille, Thermoaerobacter, Ruminococcus, Thermomicrobiales, Deferribacter, Thermodesulfobactéries, Mycobacterium, Propionibacterium, Frankia, et Bifidobactérie. Comme le montre la figure   2 , au sein du phylum Bacillus/Clostridium, la variation de fréquence de ce trait génomique est très étendue. Un schéma inhabituel est trouvé dans les familles pathogènes des Staphylococcaeceae et des Listeraceae, ainsi que dans les Lactobacillales, qui contiennent à la fois des agents pathogènes et des non-pathogènes, dans lesquels les gènes d'ARNt initiateurs ne modèlent jamais le CCA, même si les gènes tRNA élongateurs modèlent le CCA à des fréquences intermédiaires. Par exemple, chez les Staphylococcaceae, environ 60 % des gènes d'ARNt d'allongement matrice CCA et chez les Listeraceae environ 24 % des gènes d'ARNt d'allongement matrice CCA, tandis que chez Lactobacillales, 1,4 % des gènes d'allongement matrice CCA. Pourtant, parmi les 257 représentants du génome de ces trois familles dans notre ensemble de données, pas un seul ARNt initiateur de matrices de gènes CCA.

Archées

Nous n'avons trouvé aucun besoin de réannotation structurelle ou fonctionnelle des gènes d'ARNt archéens dans tRNAdb-CE v.8. La figure  3 présente un instantané de notre navigateur de données (fichier supplémentaire 11) avec certains de nos résultats les plus notables pour les gènes d'ARNt archéens. Bien qu'il y ait des fréquences assez élevées de modélisation de CCA dans les gènes d'ARNt d'archées dans l'ensemble, à 30,4%, nous avons constaté que les gènes d'ARNt d'initiateur chez Archaea ne modèlent pas la CCA à une fréquence particulièrement élevée parmi les gènes d'ARNt, ce qui présente une différence majeure par rapport aux bactéries. En dehors de cela, nous avons observé une variation phylétique étendue de ce trait à travers Archaea. Les gènes d'ARNt de Crenarchaeota modèlent le CCA à une fréquence de 50,5%, tandis que les gènes d'ARNt d'Euryarchaeota modèlent le CCA à environ la moitié de cette fréquence. Au sein de Crenarchaeota, les gènes d'ARNt dans la matrice Sulfolobales CCA à 3,8%, mais dans les Desulforococcales, cette fréquence est de 84,8%. Les quatre gènes ARNt Pyl (Pyl = pyrrolysine) modèlent le CCA dans le Methanomicrobia. Contrairement à la généralisation selon laquelle les gènes d'ARNt d'Archaea ne modèlent pas le CCA, il existe des lignées chez les Crenarchaeota et Euryarchaeota dans lesquelles tous ou presque tous les gènes d'ARNt modèlent le CCA, par exemple chez les Desulfurococcales, Protoarchaea et Methanopyri. Bien qu'il existe une variation entre les classes fonctionnelles d'ARNt dans un modèle phylétique, aucun modèle global évident n'émerge.

Données résumées sur la taille du génome et la fréquence de l'ACC dans les clades archéens ventilées par classe fonctionnelle d'ARNt. Les annotations sont les mêmes que dans la Fig.  2


MÉCANISMES DE DÉPLACEMENT DE CADRE TRADUCTION PROGRAMMÉ

Bien qu'il soit évident que l'appareil traductionnel doit maintenir fidèlement le cadre de lecture, la modification de la fidélité traductionnelle pourrait être avantageuse dans des circonstances particulières. En effet, de nombreux virus utilisent de nombreux mécanismes moléculaires, appelés génériquement recodage traductionnel. 21 These include but are not limited to directing elongating ribosomes to shift into an alternate reading frame, directing ribosomes to utilize alternative start sites, and bypassing or recoding termination codons. 5 This is particularly relevant when genomic space is physically constrained, e.g., in viruses, where genome size is limited by the volume of the viral particle. Here, expanding the information content of a viral mRNA by enabling it to encode multiple proteins may confer a selective advantage. Another idea is that the ability for a single RNA to encode multiple proteins without having to alter its sequence (e.g., through splicing), may have conferred a selective advantage in the prebiotic RNA world. 22 Additionally, the ability to recode mRNAs provides yet another level at which gene expression can be controlled. Notably, these mechanisms are all ‘programmed’ to occur at specific sequences by cis-acting elements present on mRNAs, and at rates that are two or more orders of magnitude more frequent than nonprogrammed events.

Having identified the players and defined the contexts during which PRF events occur, we will focus on molecular mechanisms that program elongating ribosomes to shift translational reading frame at specific sites along mRNAs, and discuss their physiological relevance.

−1 Programmed Ribosomal Frameshifting

Our understanding of −1 PRF originates from studies of RNA viruses, many of which use this molecular mechanism to expand the information content of their mRNAs. The relatively large number of viral −1 PRF signals has enabled definition of some of the parameters constituting a −1 PRF signal. The most well-defined −1 PRF phenomena are directed by an mRNA sequence motif composed of three important elements: a ‘slippery site’ composed of seven nucleotides where the translational shift in reading frame actually takes place a short spacer sequence of usually less than 12 nucleotides and a downstream stimulatory structure (usually an mRNA pseudoknot). A ‘typical’ −1 PRF signal is shown in Figure 1(a). In eukaryotic viruses, the slippery site has the heptameric motif N NNW WWH (IUPAC notation), where the incoming reading frame is indicated by spaces. 23 In general, it has been accepted that the downstream structure causes elongating ribosomes to pause with tRNAs positioned at the slippery site. The nature of the slippery sequence enables repairing of the nonwobble bases of both the aa and peptidyl-tRNAs with the −1 frame codons. 24 While it is generally accepted that mRNA pseudoknots are the most common type of downstream stimulatory elements, other mRNA structures are capable of filling this role as well. 25-27 Generally, it is thought that the essential function of the stimulatory structure is to provide an energetic barrier to an elongating ribosome, and to position it over the slippery site. However, the thermodynamic stability of the downstream barrier is not the sole determinant of frameshift efficiency: additional parameters, both known and unknown influence this parameter. 28

−1 programmed ribosomal frameshifting (−1 PRF). (a) From 5′ to 3′, a typical −1 PRF signal contains a heptameric slippery site, a short spacer, and a complex tertiary mRNA structure, typically an H-type pseudoknot. The original translational reading frame at the slippery site is indicated by spaces. The 22 functional slippery sites are shown. (b) The many paths to −1 PRF. As described in the text, −1 PRF can occur at three different times during translation at the frameshift signal. The pseudoknot can direct a two nucleotide translocation event either as the ribosome enters (left, boxed 1) or exits (right, boxed 3) the slippery site. Alternatively, accommodation of the aminoacyl tRNA (aa-tRNA) into the slippery site pulls the downstream mRNA into the ribosome by 9Å, creating tension between the slippery site and pseudoknot (center, boxed 2). The tension is relieved by decoupling tRNAs from the mRNA, with the mRNA slipping backward by one base.

The original simultaneous-slippage model 24 of −1 PRF suggested that peptidyl and aa-tRNAs simultaneously slip by one base in the 5′ direction to base pair with the −1 frame codons in the slippery site. From this general conceptual framework, the precise mechanistic details of −1 PRF have been debated, and three apparently competing models were proposed for the mechanism of −1 PRF. In each of these, physical slippage of the ribosome is coupled to the energetic input of GTP hydrolysis. The ‘integrated model’ model of −1 PRF posited that the shift occurs after delivery of the aa-tRNA to the A-site, but before peptidyltransfer. 23 This corresponds to Box 2 in Figure 1(b). A refinement of this model, called the ‘9Å solution’ proposed that the downstream stimulatory element plays an active role in −1 PRF by resisting 5′ movement of the mRNA subsequent to aa-tRNA accommodation (enabled by eEF1A hydrolysis of GTP). This creates tension along the mRNA that can be relieved by disengaging the tRNAs from the mRNA, thus allowing the mRNA to shift forward by one base relative to the tRNA/ribosome complex. 29 A second model proposed that −1 PRF occurs during translocation, where the energy driving slippage is supplied by eEF2 hydrolysis of GTP, and the downstream stimulatory element resists forward movement of the ribosome, resulting in translocation by only two nucleotides. Importantly, this cotranslocation model can occur through two discrete kinetic pathways. One of these pathways occurs after peptidyltransfer, with the two tRNAs moving to P/E and A/P states, followed by an incomplete, two-base translocation event. 30, 31 This is denoted by Box 3 in Figure 1(b). The second cotranslocational model proposed that incomplete translocation stimulated by the downstream element occurs one elongation cycle earlier: here, the E and P-site tRNAs slip so that the new A-site codon is in the −1 frame 32 as indicated by Box 1 in Figure 1(b).

Importantly, there is strong experimental evidence supporting all three models, suggesting that rather than explaining −1 PRF through a single molecular mechanism, −1 PRF should be conceived as a problem of kinetic partitioning occurring within the context of the translation elongation cycle. With this in mind, the ‘many pathways model’ of −1 PRF unified all three models and revealed the major steps in the translation elongation cycle that affect −1 PRF. 33 This is shown in Figure 1(b). Importantly, this model provides a mathematical framework within which estimates can be calculated regarding the relative contributions of each of the elements to rates of −1 PRF, how often ribosomes will partition between the 0 and −1 frames, and how this partitioning will distribute at each of the three possible stages of the elongation cycle. In sum, the ‘many pathways model’ of −1 PRF presents a unified theory of −1 PRF that also provides a toolbox for quantitative prediction of −1 PRF rates.

+1 Programmed Ribosomal Frameshifting

In contrast to −1 PRF where the translational reading frame is recoded by one nucleotide toward the 5′ direction of the mRNA, the elongating ribosome is induced to bypass one nucleotide toward 3′ direction in +1 PRF. +1 PRF has been observed in Escherichia coli in the translation of prfB to produce RF2. 34 In the yeast Saccharomyces cerevisiae two retrotransposable elements, Ty1 and Ty3, 35, 36 and three genes, ABP140, 37 EST3, 38 and OAZ1 39 use +1 PRF. The expression of the mammalian equivalent of yeast OAZ1, ornithine decarboxylase antizyme (i.e., OAZ), has also been shown to involve +1 PRF. 40

Unlike −1 PRF, where there is only one generally well-understood type of frameshift signal, +1 PRF signals appear case specific. However, it is clear that +1 PRF is also driven by cis-acting elements that cause elongating ribosomes to kinetically partition into the +1 frame, and that slippage of P-site tRNA appear to be the most important parameter. However, the precise mechanisms are different for different +1 PRF signals. In the bacterial cases such as the E. coli prfB mRNA, the U CUU UGA slippery site contains the in frame UGA termination codon which is recognized by RF2. 41 While translation termination is efficient when RF2 levels are high, low RF2 levels result in inefficient recognition of the UGA codon. This causes the ribosome to pause. An SD-like sequence located in the prfB mRNA immediately 5′ of the slippery site interacts with the anti-SD sequence on the 16S rRNA so as to reposition the ribosome in the +1 frame. Thus, RF2 production is autoregulated through +1 PRF. 42 More recently, mathematical modeling of the prfB +1 PRF signal revealed that this mechanism is influenced by three distinct kinetic parameters: (1) destabilization of deacylated tRNA in the E-site, (2) rearrangement of peptidyl-tRNA in the P-site, and (3) the availability of cognate aa-tRNA corresponding to the A-site. 43 While all three function synergistically to promote efficient +1 PRF, a rate constant of ≈︁1.9 s −1 for slippage of the P-site tRNA from CUU to UUU is the driving force behind this mechanism. The +1 PRF is also enhanced by the presence of a ‘hungry codon’ in the A-site (i.e., low abundance of RF2), and destabilization of tRNA–mRNA interactions in the E-site.

Eukaryotic translation does not utilize mechanisms analogous to the SD/anti-SD interactions that direct prokaryotic initiation and +1 PRF. Thus, the +1 PRF kinetic partitioning must be driven by other mechanisms. In OAZ mRNA +1 PRF, the primary kinetic trap appears to be the presence of a strong secondary mRNA structure 3′ of the slippery site. However, the element that stimulates OAZ +1 PRF has undergone a significant amount of evolutionary divergence. For example, while almost all vertebrate OAZ +1 PRF signals involve mRNA pseudoknots, fewer protostome OAZ sequences contain predicted pseudoknots, most nematodes lack the ability to form this type of structure, and no pseudoknots can be calculated in any yeast/fungi or insect OAZ +1 PRF signals. 39 Similarly, the slippery sites of OAZ have diverged. The metazoan OAZ slippery site is UCC UGA U, 44 but has degenerated in fungi and arthropods. 45 Importantly, similar to prfB, the OAZ +1 frameshift is stimulated by a 0-frame A-site UGA codon, and is also primarily dependent on tRNA–mRNA interactions in the ribosomal P-site. For example, mutation of the rat OAZ P-site sequence from UCC to CCC inhibited frameshifting in S. cerevisiae. 39 Also similar to pfrB, the E-site of the OAZ +1 PRF signal also modulates frameshifting efficiency, although this is less well understood. 39 OAZ +1 PRF is also autoregulated: it is stimulated by polyamines. 46 Neutralization of negative charge repulsion by positively charged polyamines may facilitate the formation of mRNA–rRNA interactions that enhance tRNA slippage in the P-site while the ribosome is paused at the 0-frame UGA termination codon. Importantly, OAZ +1 PRF is autoregulated. Ornithine decarboxylase (ODC) catalyzes the first step in polyamine biosynthesis, while OAZ downregulates polyamine synthesis by stimulating ubiquitin-independent degradation of ODC by the proteasome. Thus, increased levels of polyamines negatively feedback on polyamine synthesis by stimulating +1 PRF, and hence the synthesis of OAZ.

The yeast Ty retrotransposable elements utilize +1 PRF to direct synthesis of Gag-pol fusion proteins. 47 The Ty1 slippery site is CUU AGG C. 35 Like prfB and OAZ, the frameshift is primarily driven by slippage of the P-site tRNA from CUU to UUA. Unlike the prior two examples however, this slippery site does not contain a 0-frame termination codon. Rather, the kinetic trap is supplied by the rare A-site AGG codon, which is decoded by the low abundance Arg-tRNA CCU tRNA. Overexpression of this tRNA caused a 50-fold decrease in +1 PRF, while deleting it caused +1 PRF efficiency to approach 100%. 48 The +1 frameshifts of Ty2 and Ty4, and other members of the copie family of retrotransposable elements are thought to utilize this mechanism of tRNA slippage, as well as the yeast ABP140 frameshift signal. 37, 49 While, the genome organization of the Ty3 gypsy-like yeast retrotransposon is similar to Ty1, 50 its +1 PRF signal is different. The GCG AGU U slippery site disallows the possibility of the 0-frame tRNA in the P-site to base pair with the +1 frame. 36 It is thought that Ty3-directed +1 PRF involves skipping the first A of the 0-frame P-site codon followed by recognition of the +1 frame GUU codon. Further analysis demonstrated that +1 PRF depended on some special characteristic of the Ala-tRNA UGC , and that this was also shared by four more tRNAs. A downstream stimulatory element is also been proposed to constitute the kinetic trap utilized in Ty3 +1 PRF. While the original hypothesis involving direct base pairing between this sequence and the 18S rRNA helix 18 51 has been ruled out, a very stringent set of mutagenesis experiments suggest that the Ty3 stimulatory element may interact with rRNA and ribosomal proteins in the ribosomal entry tunnel, as well as unknown constituents of the solvent face of the 40S subunit. 52 Interestingly, while the EST3 slippery site is identical to that of Ty1 and frameshifting is dependent on limiting quantities of cognate A-site tRNA, its +1 PRF signal also contains a downstream stimulatory element. 53 It has been speculated that interaction of this element with specific targets of the paused ribosome may limit A-site access by tRNAs.


Question : Question 1 10 Points Which of the following statements regarding the genetic code is FALSE? An amino acid is coded for by only one codon. A codon codes for a single amino acid. More than one start codon may occur within a single mRNA, resulting in multiple translation initiation points. The genetic code is nearly universal. Question 2 10

Which of the following statements regarding the genetic code is FALSE?

An amino acid is coded for by only one codon.

A codon codes for a single amino acid.

More than one start codon may occur within a single mRNA, resulting in multiple translation initiation points.

The genetic code is nearly universal.

All compounds that have been found to be mutagenic in the Ames test are also carcinogenic.

Why are liver extracts used in the Ames test?

Liver enzymes may activate some innocuous compounds, making them mutagenic.

The bacteria require the nutrients present in the liver extract for growth.

A liver extract is necessary for the bacteria to produce histidine revertants.

Liver enzymes activate the bacterial enzymes.

What would be the effect of a mutation in the lacI gene that prevented the repressor from binding to lactose?

Les lac Z, Y, and A genes would be repressed by lactose.

Les lac Z, Oui, et UNE genes would not be expressed.

Les lac Z, Oui, et UNE genes would be induced by lactose.

Les lac Z, Oui, et UNE genes would be expressed constitutively.

At which site does the charged initiator tRNA bind during protein synthesis?

What is the consequence of a mutational event that inserts a single nucleotide into a gene?

The rate of transcription would increase.

It would start the translation of another gene.

A frameshift mutation would occur.

The rate of transcription would decrease.

All EXCEPT which of the following molecules are found in tRNA molecules?

Which term describes sequences that are similar (homologous) in different genes of the same organism or in one or more genes of related organisms?

Which of the following occurs in prokaryotes but not in eukaryotes?

transcription et traduction couplées

addition of a poly-A tail to mRNA

Une mutation dans le je gene directly affects the promoter of the lac opéron.

Which bacteria grow on the agar plate if the Ames test is positive?

Which repair system uses the RecA and LexA proteins?

Why are frameshifts one of the most severe types of mutations?

They occur only in gametes.

More than one amino acid, or even entire proteins, is affected.

More than one gene is affected.

In the genetic code, "wobble" involves __________.

Which amino acids would be incorporated in a protein using an RNA with a repeating AU copolymer?

Isoleucine and tyrosine would both be incorporated into the protein.

Leucine (Leu) would be incorporated into the protein.

Phenylalanine (Phe) would be incorporated into the protein.

The peptide would consist of poly-isoleucine (Ile).

Which of the following statements best describes the function of aminoacyl tRNA synthetase?

It provides the energy required to attach a specific amino acid to a tRNA molecule.

It synthesizes tRNA molecules.

It attaches a specific amino acid to a tRNA molecule.

It helps tRNA synthesize proteins.

Which of the following statements about the effects of enhancers and transcription factors (TFs) on gene expression is true?

Enhancers are cis-acting TFs are trans-acting.

Enhancers are trans-acting TFs are cis-acting.

Which of the following components is the first to bind to the mRNA during the assembly of the translation complex?

the small ribosomal subunit

the large ribosomal subunit

In prokaryotes, the initial amino acid in a polypeptide chain is the modified form of methionine, N-formylmethionine, or fMet. Which term describes the codon for fMet?

Ultraviolet radiation causes __________.

formation of pyrimidine dimers

Which RNA polymerase transcribes protein-coding genes into mRNA in eukaryotes?

What is the consequence of a gene mutation that results in a UGA codon in the reading frame of its mRNA?

A partial polypeptide chain would be synthesized, because the mutation would cause premature release of the polypeptide from the ribosome.

It would start the translation of another gene.

It would cause a frameshift mutation.

A tRNA synthetase recognizes an amino acid and all of its cognate tRNAs. What is another term for different tRNAs that accept the same amino acid?

Which of the following is found in both prokaryotes and eukaryotes?

addition of a poly-A tail to mRNA

transcription et traduction couplées

Name a mechanism for termination of transcription of a gene in prokaryotes.

development of a hairpin loop by the RNA folding back on itself

a region called the TATA box

What is the function of transcription factors?

to recognize cis-acting elements in the gene to regulate transcription

to direct mRNA from the nucleus to the cytoplasm

to initiate binding at the Shine–Dalgarno sequence

to serve as sequences where RNA polymerase binds

Which of the following elements are cis-acting?

What is the function of the AAUAAA sequence near the 3′ end of a eukaryotic transcript?

binding site for RNA polymerase

recognition site for cleaving the transcript prior to adding the poly-A tail

binding site for the ribosome

binding site for DNA polymerase

To which region of a tRNA molecule does an amino acid get attached?

Why did Nirenberg and Matthaei use polynucleotide phosphorylase instead of RNA polymerase in their experiments using a cell-free system?

RNA polymerase does not function in vitro.

Polynucleotide phosphorylase requires a DNA template.

Polynucleotide phosphorylase can synthesize polypeptides in vitro.

Polynucleotide phosphorylase does not require a DNA template.

Which of the following would most likely reduce the rate of transcription of a gene?


Protein Synthesis of Prokaryotic and Eukaryotic Systems

The following points highlight the six main stages involved in protein synthesis of prokaryotic and eukaryotic systems. The stages are: 1. Amino Acid Activation and Formation of Amino Acyl-t-RNA 2. Binding of m-RNA to the Ribosome 3. Formation of Initiation Complex 4. Polypeptide Chain Elongation 5. Polysomes 6. Co Transcriptional Translation.

Stage # 1. Amino Acid Activation and Formation of Amino Acyl-t-RNA:

Amino acids require to be raised to a higher energy level to make them competent to be transferred to the t-RNAs. The activation of amino acids occurs by addition of AMP from ATP catalyzed by the enzyme amino acyI synthetase. The pyrophosphate group of ATP is released in the process. The same enzyme also catalyses the transfer of amino-acyI-AMP to its specific t-RNA. All protein amino acids are amino acids having the general structure.

The two-step reaction catalyzed by amino-acyI synthetase is:

The synthetase-bound amino acyl-AMP next reacts with its appropriate t-RNA producing amino acyl-t-RNA and AMP is set free. All t-RNA molecules possess a CCA sequence at the 3′-(OH) end. The amino acyl group of the amino acyl-AMP is transferred to the terminal adenylic acid of CCA sequence with the formation of a covalent linkage with either the 2′ or 3′ (OH) group of the ribose of adenylic acid as shown below (Fig. 9.41).

It should be specially mentioned that just as each amino acid is selected by its specific t-RNA, so also the formation of an amino acyl-t-RNA is catalysed by a specific amino acyl synthetase. A synthetase molecule can recognize its specific t-RNA with the help of the three-dimensional conformation of the protein molecule and that of the t-RNA.

It must also recognize the specific amino acid. Thus, in the intracellular pool, there are many different synthetase molecules, each of which is specific for both an amino acid and its cognate t-RNA. This one-to-one relationship is complicated by the presence of more than one t-RNA for most of the amino acids. To match the different codons of the same amino acid, there are different t-RNAs carrying complementary anticodons.

Once amino acyl-t-RNA has been formed, the amino acid plays no active role in selecting the site where it is to be inserted in the polypeptide chain, because it has no means to recognize the codon. It is carried passively by the t-RNA to its appropriate site. The t-RNA recognizes the m-RNA codon with its anticodon and brings the amino acid to its proper site.

Stage # 2. Binding of m-RNA to the Ribosome:

Protein synthesis does not take place on free m-RNA, but only on m-RNA bound to ribosomes. That is why ribosomes are sometimes referred to as ‘work-benches’ of protein synthesis. In both prokaryotes and eukaryotes, the m-RNA binds first to the small subunit of the ribosome i.e. the 30S subunit in prokaryotes and the 40S subunit in eukaryotes. The large subunit of the ribosomes is attached later to form the initiation complex.

In the prokaryotes, the m-RNA binds to 30S ribosomal subunit before the first amino acid is carried by the t-RNA. The first codon to initiate protein synthesis is AUG, but this initiator codon is preceded by a 20-30 nucleotide long sequence at the 5′-end of m-RNA. This means that the initiator codon (AUG) is situated 20-30 nucleotides downstream from the 5′-end. Within this preceding sequence, there is a short consensus sequence consisting of 5′–AGGAGGU-3′ situated 4 to 7 nucleotide ahead of the initiator codon AUG.

This consensus sequence is known as the Shine-Dalgarno sequence. This sequence helps in binding of m-RNA to the 30S subunit by forming base-pairs with its 16S r-RNA. At the same time, this sequence also acts as a signal for initiating protein synthesis at the next AUG sequence.

This is diagrammatically shown in Fig. 9.42:

The initiator codon codes for methionine, but all prokaryotic proteins have formyl-methionine (fmet) as the first amino acid at the amino terminus. In prokaryotes, t-RNA met picks up methionine with the help of methionyl t-RNA synthetase and methionine is then formylated by another enzyme, transformylase, the donor of the formyl group being N 10 -formyl-tetrahydrofolate (formyl-THF). The formyl group is attached to the amino group of methionine.

The transfer reaction is:

Formylation of methionine can only occur when methionine is carried by t-RNA fmel and not when methionine is charged on t-RNA met Thus, t-RNA fmet and t-RNA mcl are two distinct species although both are amino acylated by the same synthetase. The latter, i.e. t-RNA™’, carries methionine to the codon AUG situated inside the m-RNA but not to the initiator AUG codon.

In eukaryotic proteins, the first amino acid at the amino terminus is methionine and not formyl- methionine as in prokaryotes and the initiator codon is the same, i.e. AUG. However, in eukaryotes also, the initiator t-RNA met and t-RNA met for internal methionine are two distinct species. The former recognizes only the initiator AUG codon and no other AUG codons.

The initiator codon in eukaryotic m-RNA is situated 50 to 100 nucleotides downstream from the 5′ end. The 5′ end of eukaryotic m-RNA’s is always capped by methyl guanosine. This capped end binds to the 40S subunit of ribosome and the ribosomal subunit then moves along the m-RNA in the 5′ —> 3′ direction and scans the m-RNA triplets until it reaches an AUG sequence. At this point the initiation complex is formed, thereby also fixing the reading frame.

Organiser # 3. Formation of Initiation Complex:

An initiation complex is an m-RNA-bound complete ribosome in which the initiator t-RNA carrying the first amino acid is attached and ready to receive the next incoming amino acid-charged t-RNA. In prokaryotes, formation of an initiation complex is preceded by the formation of a pre-initiation complex which is composed of the 30S subunit of the ribosome, the m-RNA molecule, a charged t-RNA fmet , three non-ribosomal proteins (initiation factors, IF) IF1, IF2 and IF3 and a molecule of GTP. The initiation factors, IF1 and IF3, help to dissociate the 70S ribosomes into 30S and 50S subunits, so that m-RNA can bind to the 30S subunit to form a pre-initiation complex.

The initiation factor IF2 mediates binding of GTP and the charged t-RNA fmet to the pre-initiation complex. Two other ribosomal proteins, SI and S12 are necessary for binding the m-RNA to the 16S r-RNA of the 30S subunit (Shine-Dalgarno sequence).

After the formation of the pre-initiation complex has been completed, the 50S subunit of the ribosome binds to it resulting in liberation of IF1. Next, IF2 is released by hydrolysis of GTP to GDP+Pi. With the attachment of the 50S subunit, the formation of initiation complex is completed.

The stepwise formation is shown in Fig. 9.43:

The binding of the 30S and 50S subunits creates two sites for binding of two t-RNA molecules. These are called the amino acyl site (A site) and the peptidyl site (P site). These sites overlap both the subunits of ribosome. The initiator, t-RNA fmet carrying formyl-methionine which was bound to the pre-initiation complex, is transferred to the P site of the initiation complex where its anticodon pairs with the initiator codon AUG of the m-RNA. The initiation complex is now ready for chain elongation.

So far as it is known, the sequence of events in the formation of the initiation complex in eukaryotes does not differ essentially from that of the prokaryotes, except that the number of initiation factors is more (at least nine) and binding of the m-RNA requires hydrolysis of ATP, a feature not known to occur in prokaryotes. In eukaryotes the initiator t-RNA carries methionine and not formyl-methionine as in prokaryotes. The initiator codon is the same i.e. AUG in both prokaryotes and eukaryotes.

Organiser # 4. Polypeptide Chain Elongation:

In the initiation complex, the P site is occupied by the t-RNA fmet and the A site is vacant. It is now ready to be occupied by the incoming t-RNA carrying an appropriate amino acid. The anticodon of this t-RNA must match with the triplet of m-RNA positioned at the A site. The binding of the t-RNA to the A site requires a non-ribosomal cytoplasmic protein factor, called the elongation factor Tu (EF-Tu) which is activated by GTP.

The three components, viz. t-RNA, EF-Tu and GTP, form a ternary complex which binds to the A site of the ribosome. In this binding process, the TᴪC arm of t-RNA (see structure of t-RNA) is thought to interact with the 5S r-RNA of the 50S subunit of the ribosome. Once the charged t-RNA (incoming) binds firmly to a site of the ribosome, GTP is hydrolysed by a ribosomal protein enzyme to release GDP-EF-Tu and inorganic phosphate.

The A site is now occupied by the incoming t-RNA carrying the second amino acid. From the GDP-EF-Tu binary complex, GTP-EF-Tu is regenerated by another protein factor, called EF-Ts and inorganic phosphate. GTP-EF-Tu can then combine with the next incoming aminoacyl t-RNA to form the ternary complex.

The sequence of events are diagrammatically represented in Fig. 9.44:

The second step in the chain elongation process involves the formation of a peptide bond between the α-amino group the amino acid occupying the A site and the α-carboxyl group of the amino acid occupying the P site.

However, the peptide bond formation takes place by a complex reaction, because the carboxyl group of the amino acid in amino acyl-t-RNA at the P site is not free, but linked to the adenylic acid residue of CCA sequence of t-RNA (see Fig. 9.41).

The reaction is called peptidyl transferase reaction. It takes place in the 50S subunit of the ribosome. As a result of the reaction, the P site is now occupied by an uncharged t-RNA (without amino acid) and the A site is occupied by a t-RNA with a dipeptide as shown in Fig. 9.45.

In the next step, the t-RNA with the bound dipeptide moves from the A site to the P site displacing the empty t-RNA fmet . The movement is known as translocation and it is catalysed by another elongation factor EF-G which binds to the ribosome. In the process, hydrolysis of GTP catalysed by a ribosomal protein is known to occur.

Concurrent with translocation from the A site to P site, the m-RNA also moves through one coding unit in the 3′ —> 5′ direction. Thereby, the next codon is positioned at the A site. These processes of peptidyl transferase reaction and translocation take place with addition of each amino acid carried by the respective t-RNAs. As a result, the polypeptide chain elongates at the amino-terminal end by sequential addition of amino acids one by one determined by the matching of t-RNA anticodon and m-RNA codon.

The final step of protein synthesis is reached when, at the A site, one of the three termination codons (UAA, UAG or UGA) of m-RNA appears. As these codons do not code for any amino acid (that is why they are called nonsense codons), the A site remains vacant. The polypeptide chain is released from the ribosome through the action of a release factor (RF).

In prokaryotes, there are three release factors, RF1, RF2, and RF3. They bind to the ribosome and catalyse hydrolysis of the ester linkage between the t-RNA occupying the P site and the carboxyl group of the last amino acid. Thereby the polypeptide chain becomes free to be released from the ribosome. The 70S ribosome then falls off from the m-RNA.

Organiser # 5. Polysomes:

In considering protein synthesis above, the mutual relation between an m-RNA and a single 70S ribosome has been dealt with. However, in practice, a single m-RNA molecule is used for multiple translation in both prokaryotes and eukaryotes. Such a practice is economical for the cell, because several copies of the same protein can be produced in a relatively short time without going through the process of transcription.

When the chain elongation phase of polypeptide synthesis has advanced to a stage, so that the chain is 25-30 amino acid long, the initiator AUG codon of the m-RNA becomes free to form another initiation complex in the same way as it formed the first one. So, a second 70S ribosome initiates synthesis of a second copy of the same polypeptide.

In this way initiation may be repeated several times on different ribosomes, thereby forming a string of ribosomes bound by a common m-RNA molecule. Such a structure is called a polyribosome or polysome. The size of a polysome varies according to the length of the m-RNA molecule.

There may be 3 to 4 or as many as 100 ribosomes in a polysome. It is obvious that polypeptide synthesis terminates in the first ribosome and then in the second and so an. At any given time, the length of the polypeptide chains varies depending on the progress of chain elongation in the ribosomes of a polysome complex.

A diagrammatic representation of polypeptide synthesis in a polysome is shown in Fig. 9.46:

Organiser # 6. Co Transcriptional Translation:

In eukaryotes, the primary transcript, known as hn-RNA has to be processed by removing the introns, capping the 5′-end and adding a poly A-tail at the 3′ end. The processed product, the m-RNA, is then trans-located from the nucleus into the cytoplasm through pores in the nuclear membrane. In contrast, the primary transcript in prokaryotes is used directly as the m-RNA.

Also, the nuclear material is not separated by a membrane from the cytoplasm. A characteristic feature of the prokaryotic protein synthesis is, therefore, that translation of the m-RNA can begin while the m-RNA is still being transcribed from the template strand of DNA. This is known as simultaneous transcription and translation, or co-transcriptional translation.

As the RNA polymerase moves along the DNA template strand, 5′ end of the m-RNA comes out and binds to a 30S subunit by base-pairing with the Shine-Dalgarno sequence. An initiation complex is formed in the usual way and polypeptide synthesis begins. With progress of transcription, the m-RNA grows in length and it can bind more ribosomes forming a polysome (Fig. 9.47).

The phenomenon of co-transcriptional translation in prokaryotes assumes special significance in view of the fact that prokaryotic messengers are very short-lived having an average half-life only 1.3 to 1.8 minutes. Simultaneous transcription and translation can, therefore, make best use of a messenger molecule by shortening the two processes through coupling them.

In E. coli the rate of transcription at 37°C is 55 nucleotides/sec and that of translation is 17 amino acids per second. Therefore, transcription which is faster can run concurrently with the slower process of translation. Thereby the total time for protein synthesis can be considerably reduced.


Sommaire

  • transcription of the information encoded in DNA into a molecule of RNA (discussed in Gene Expression: Transcription) and
  • Traduction of the information encoded in the nucleotides of mRNA into a defined sequence of amino acids in a protein (discussed here).

Dans eucaryotes, the processes of transcription and translation are separated both spatially and in time. Transcription of DNA into mRNA occurs in the nucleus. Translation of mRNA into polypeptides occurs on polysomes in the cytoplasm.

Dans bactéries (which have no nucleus), both these steps of gene expression occur simultaneously: the nascent mRNA molecule begins to be translated even before its transcription from DNA is complete.


Remerciements

D.J. is a PhD fellow at the Fonds National de la Recherche Scientifique (aspirant FNRS). This work was supported by grants from the Fonds Jean Brachet and the Fondation Van Buuren to L.D. from the FNRS (grant number F.4505.16 MIS), the Fonds d'Encouragement à la Recherche ULB (FER-ULB), the Fonds Jean Brachet and the Fondation Van Buuren to A.G.P. and from the FNRS (grant number 3.4621.12 FRSM, T.0147.15F PDR and J.0061.16F CDR), the Interuniversity Attraction Poles Program initiated by the Belgian Science Policy Office (MICRODEV), the Fonds Jean Brachet and the Fondation Van Buuren to L.V.M. The authors would like to thank J.M. Sanz for initial work in characterizing the ataR–ataT système.


DISCUSSION

Overall, our studies show that by fine tuning formylation efficiencies (by introducing mutations in the acceptor stem of tRNA fMet ), it is possible to direct a tRNA into either the initiation or the elongation pathways, providing an insight into the evolution of distinct methionine tRNA species. As Fmtmont primarily recognizes the amino acid attached to the tRNA, mitochondrial tRNA Met could be driven either into the initiation or elongation by regulating the levels of formylase enzyme. As opposed to this, eubacterial Fmt recognizes sequence elements on the tRNA fMet body itself. Although this necessitates the presence of two distinct tRNAs for initiation and elongation functions, we have shown that it is possible to change the fate of the tRNA by altering the formylatability of the tRNA fMet . However, instead of regulation at the level of Fmt expression, shifting the balance of fate in bacterial systems require sequence changes in the determinants of the Fmt enzyme, a mechanism that could have been adopted during the evolution of distinct tRNAs for initiation and elongation. Interestingly, the mutant that is most efficient at sustaining initiation and elongation together, U1/U3:A70, is also the one that is most similar to the human mitochondrial methionine tRNA ( Supplementary Figure S1 ), supporting such an idea.

mutations dans le MTFMT gene encoding human mitochondrial formylase cause Leigh syndrome and combined OXPHOS deficiency ( 25). Such patients show a significant reduction in the levels of fMet-tRNA Met , with a severe defect in mitochondrial translation. Interestingly, the triple knockout strains supported by the U1/U2:A71 mutant (which has the least amount of formylated species at steady state, Figure 1E) shows slowest growth among the three triple knockout strains in our E. coli knockout system. In addition, our study provides insights into bacterial protein synthesis and the delicate balance of protein factors and sequence elements in the acceptor stem of tRNA fMet that decide the fate of the bacterial i-tRNA (Figure 4).

Model for alternate fates of the bacterial initiator tRNA. Following aminoacylation by MetRS, the formylability of the initiator tRNA by Fmt determines its entry into either initiation (by binding of the formylated species to IF2) or elongation (by binding of the unformylated species to EFTu). Partitioning of tRNA fMet between various factors (Fmt/IF2 or EFTu) determines its fate in protein synthesis.

Model for alternate fates of the bacterial initiator tRNA. Following aminoacylation by MetRS, the formylability of the initiator tRNA by Fmt determines its entry into either initiation (by binding of the formylated species to IF2) or elongation (by binding of the unformylated species to EFTu). Partitioning of tRNA fMet between various factors (Fmt/IF2 or EFTu) determines its fate in protein synthesis.

We noted the existence of i-tRNA variants that harbor U1:A72 pair, U1:G72 wobble pair, or a G1:C72 pair in the acceptor stem in many of the sequenced bacterial genomes. Although not known so far, our observation provides a basis for the possibility of natural occurrence of a single tRNA system for initiation and elongation in at least some bacteria. Importantly, together with our earlier studies ( 26, 27), our current finding reinforces the use of E. coli as a model to investigate the evolutionary and mechanistic aspects of the mitochondrial protein synthesis.