Informations

Quelle est l'ampleur du changement de protéines dû à l'épissage alternatif ?

Quelle est l'ampleur du changement de protéines dû à l'épissage alternatif ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Quelle est la différence entre les protéines codées à partir de la même séquence d'ADN mais qui subissent un épissage alternatif ?

Ce que j'essaie de comprendre, c'est pourquoi nous sommes si obsédés par les séquences d'ADN et ce pour quoi elles codent, si le résultat peut être très différent en raison de l'épissage alternatif.


Pour votre première question, ils peuvent varier considérablement.

Je n'ai pas posté à l'origine comme réponse formelle car ma déclaration ci-dessous est difficile à citer une source et serait donc quelque peu subjective, bien que je sois assez confiant dans l'affirmation. Il est basé sur ma propre expérience dans la lecture de la littérature GWAS et EWAS. Mes recherches portent sur les méthodes d'analyse de telles données.

Pour répondre à votre deuxième question, l'objectif principal est passé de la variation génétique (toujours faite cependant) à la variation d'expression et à la variation épigénétique. La recherche d'expression se concentre exactement sur le type de problème dont vous discutez avec l'épissage alternatif, et cela est largement possible en raison de la diminution du coût de RNAseq. Nous ne sommes plus aussi obsédés par la séquence ; l'avènement du GWAS, autrefois considéré comme une panacée pour l'explication de la susceptibilité aux maladies, n'a fini par expliquer qu'une fraction des estimations de l'héritabilité génétique. Cela ne veut pas dire qu'il n'est pas ciblé, uniquement dans le contexte d'autres types de variations et d'expositions environnementales.


Épissage alternatif

Résumé

L'épissage alternatif est le processus de sélection de différentes combinaisons de sites d'épissage au sein d'un précurseur d'ARN messager (pré-ARNm) pour produire des ARNm à épissage variable. Ces ARNm multiples peuvent coder pour des protéines qui varient dans leur séquence et leur activité, et pourtant proviennent d'un seul gène. L'épissage alternatif est un mécanisme important dans le contrôle spécifique du développement et du type cellulaire de l'expression des gènes, et en tant que mécanisme pour augmenter la diversité du protéome. On le trouve dans presque tous les organismes eucaryotes qui effectuent l'épissage standard du pré-ARNm nucléaire, y compris les animaux, les plantes et, dans certains cas, les champignons. L'épissage alternatif est modulé par de nombreuses protéines qui interagissent avec un large éventail de séquences amplificatrices et suppressives d'épissage.


Fond

Les insertions/suppressions de séquences (indels) se produisent au cours de l'évolution et du processus d'épissage alternatif (AS) chez les eucaryotes. La génération de diverses isoformes de protéines par épissage alternatif a été considérée comme l'un des principaux mécanismes évolutifs pour augmenter la taille du protéome et la diversité fonctionnelle [1, 2]. Une analyse récente à haut débit basée sur les données ARNm-SEQ de divers tissus humains et lignées cellulaires a suggéré que l'épissage alternatif est presque universel (jusqu'à 94%) dans les gènes multi-exons humains [3]. Bien qu'il existe plusieurs types d'événements d'épissage qui entraînent différentes isoformes d'épissage par rapport aux séquences primaires, telles que la troncature, la substitution, l'insertion et la suppression, les cas d'insertion/délétion internes sont la forme dominante des variantes d'épissage alternatif et sont d'un grand intérêt en raison de son impact potentiel sur le pliage et la stabilité des structures isoformes [3, 4]. De plus, les gènes contenant des exons "switch-like" sont plus susceptibles d'avoir des isoformes avec des indels [3]. Il est essentiel pour notre compréhension de la fonction des isoformes de protéines à épissure alternative si nous savons comment les changements de séquence, en particulier les insertions et les suppressions de séquence, affectent la structure des variantes d'épissage, car les structures détiennent des informations clés pour la fonction des protéines.

Nos connaissances actuelles sur la façon dont l'épissage alternatif affecte les structures des protéines sont très limitées. Bien qu'il existe environ 28 000 isoformes de protéines annotées de la récente version 15.11 d'UniProt (24 novembre 2009) [5] et plus de 60 000 structures de protéines déposées dans la Protein Data Bank (PDB) [6], moins de 10 paires d'isoformes à épissure alternative ont des structures documentées. [7]. La prédiction des structures isoformes entre généralement dans la catégorie de la modélisation par homologie. Cependant, la modélisation d'homologie de protéines avec des indels n'est pas une tâche triviale. La clé du succès de la modélisation d'homologie avec des indels est la précision de l'alignement, en particulier le positionnement des séquences d'insertion ou de suppression. Par exemple, plusieurs groupes à CASP8 (la 8e expérience communautaire sur l'évaluation critique des techniques de prédiction de la structure des protéines) ont utilisé la même protéine 2G39 comme modèle pour modéliser la protéine cible T0438, mais seuls trois des neuf modèles ont placé la séquence d'insertion (12 acides aminés) au bon endroit [8]. Un autre exemple tristement célèbre/célèbre de positionnement indel est la modélisation de l'isoforme AS longue de Piccolo C2Un domaine qui a une insertion de neuf résidus dans une boucle. Au lieu de se replier dans le cadre de la boucle, l'insert à neuf résidus déplace un brin qui est poussé dans la région de liaison au calcium par un réarrangement local, entraînant un changement spectaculaire de l'affinité de liaison au calcium [9].

Bien qu'il soit généralement admis que les insertions et les suppressions sont bien tolérées dans les boucles [10, 11], les insertions et les suppressions au sein des structures secondaires (hélices α et feuillets ) peuvent avoir un effet dramatique sur la structure globale et sont considérées comme délétères et défavorables. au cours de l'évolution [4, 12]. Tresse et al. a fait valoir que l'isoforme AS est probablement une voie improbable pour augmenter la diversité fonctionnelle en raison de l'impact structurel probablement important induit par les indels [4]. Pourtant, dans un certain nombre d'études avec des insertions et des suppressions génétiquement modifiées sur le lysozyme T4, le groupe de Matthews a montré que la protéine a une plasticité structurelle pour tolérer les indels dans les structures secondaires [13-15]. Trois analyses récentes à grande échelle ont également offert une vue similaire selon laquelle les structures protéiques ont un certain degré de « plasticité » pour tolérer les insertions et les suppressions en maintenant le même pli structurel [16–18].

L'objectif principal de cet article est d'étudier l'impact des indels internes courts (moins de 40 acides aminés) sur les structures des protéines, en particulier pour les indels au sein des structures secondaires. Les grands indels peuvent se replier en un domaine individuel ou les paires de protéines peuvent adopter des replis différents en raison des grandes différences entre deux séquences [8]. Les indels terminaux ne sont pas pris en compte dans cette étude car les fragments terminaux sont relativement flexibles et la délétion/troncation terminale est devenue un protocole standard dans l'expression de protéines recombinantes et la cristallisation de protéines [19-21]. De plus, les vecteurs de clonage largement utilisés avec des balises His introduisent des artefacts de séquence qui sont inclus dans les enregistrements PDB SEQRES et la détermination des séquences exactes des balises est problématique [22, 23]. Bien qu'il existe plusieurs enquêtes similaires sur les statistiques des indels depuis 1992 [10, 24-27], notre approche est différente car notre objectif est d'étudier l'impact des indels sur la structure des protéines et de fournir des conseils pour la prédiction de la structure des isoformes. Par conséquent, il est essentiel que les emplacements des indels soient uniques et sans ambiguïté. Sinon, les changements structurels seraient moins bien définis. Par exemple, il n'est pas rare que deux protéines ayant une identité de séquence globale élevée aient une faible similarité de séquence locale [28]. Pour résoudre ce problème, nous prenons en compte la similitude des séquences locales et ne considérons que les paires de protéines avec une similitude de séquences globale et locale élevée (séquences flanquant les indels) (>75%) pour assurer l'unicité des séquences et des positions indel. De plus, nous incluons la « conformation désordonnée » dans notre analyse structurelle. Il a été démontré que des régions intrinsèquement désordonnées ou non structurées sont responsables de nombreuses fonctions cellulaires importantes et un lien entre l'épissage alternatif et le désordre intrinsèque des protéines a été récemment rapporté [17, 29, 30].

Dans cet article, nous rapportons une analyse systématique d'un grand ensemble de données indel non redondant avec des paires de protéines hautement homologues. Auparavant, nous avons constaté que la famille des immunoglobulines (Ig), riche en certains acides aminés, notamment la tyrosine, la glycine et la sérine dans la troisième région déterminante de la complémentarité de la chaîne lourde des Ig (CDR-H3), était surreprésentée dans un ensemble de données indel [28, 31, 32]. Par conséquent, ces séquences indel liées aux Ig ne sont pas prises en compte dans notre analyse actuelle. Nos résultats montrent que les indels internes ont tendance à avoir des structures secondaires moins régulières (hélices α et brins ), mais sont riches en « conformation désordonnée », ce qui est en accord avec les travaux de Romero et al [17]. Nos données montrent également que les protéines avec des indels courts, y compris ceux dans les structures secondaires régulières, préservent généralement le repli structurel avec un certain réarrangement local de la structure et un repliement vraisemblablement pour la stabilité structurelle et la fonctionnalité. La source de l'indel, qu'elle soit naturelle ou modifiée expérimentalement, est décrite et la signification statistique des caractéristiques des indels naturels est discutée. Un serveur Web SCINDEL http://bioinfozen.uncc.edu/scindel a été développé pour une visualisation pratique des changements structurels induits par indel.


Résultats

Profilage AS dans GBM par récurrence

Nous avons profilé 37 échantillons de GBM humains provenant de 23 patients, 19 cas primaires non traités et 18 cas récurrents traités avec un traitement standard (radiothérapie, témozolomide et résection chirurgicale). 34 échantillons étaient des échantillons longitudinaux appariés aux patients (Fig. 1a Fichier supplémentaire 1 : Tableau S1). Nous avons effectué un RNA-seq sur chacun de ces échantillons, générant plus de 277 millions de lectures par échantillon. De plus, nous avons obtenu 15 ensembles de données publics d'ARN-seq à partir d'échantillons longitudinaux de GBM et 29 ensembles de données publics d'ARN-seq à partir de tissus cérébraux adultes et fœtaux non malins (section « Matériels et méthodes »).

une Aperçu conceptuel de la conception de l'étude et des échantillons utilisés. b Intégration du voisin stochastique distribué en T (tSNE) de l'AS PSI dans les échantillons de cerveau non malin GBM primaire, GBM récurrent et GTEx. c Un péché b, mais PCA. Analyse de l'ontologie génique Wikipathway Cancer des gènes dans les 20 % supérieurs de la composante principale positive et négative de c. e Les distributions des types de SA dans les événements de SA spécifiques à la tumeur, en comparant les GBM primaires et récurrents

Nous avons construit un modèle intégré de SA entre le cerveau non malin, les conditions GBM primaires et récurrentes via MAJIQ [4] (Fig. 1b section « Matériels et méthodes »). Nous avons constaté que les échantillons de cerveau non malins formaient un groupe distinct, se séparant des échantillons de GBM primaires et récurrents, lorsqu'ils étaient visualisés dans une analyse en composantes principales (ACP) d'indices marginaux sélectionnés en pourcentage (PSI) (Fig. 1c Fichier supplémentaire 2 : Tableau S2). Les valeurs PSI ont été calculées via le modèle bayésien de MAJIQ et estiment les fréquences avec lesquelles les jonctions d'épissage sont sélectionnées dans les événements AS. Une analyse génique-ontologique des événements de SA dont les PSI chargeaient de manière variable le composant principal un a révélé la signalisation du facteur de croissance (par exemple, PDGFRB, PIK3R1, FOS, MAPK9), facteur de croissance tumorale (par exemple, TGFB1, SMAD2, SMAD4) et pro-inflammatoire (par exemple, NFKB1, RELA, STAT1, STAT3) signalisation (Fig. 1d, Fichier complémentaire 3 : Fig. S1). Les proportions relatives des types d'événements de SA étaient stables lorsque l'on comparait la maladie primaire et récurrente (Fig. 1e).

Identification de cibles pour la thérapie par cellules T autologues

Nous avons commencé par dépister des cibles spécifiques au GBM dans des néojonctions spécifiques au cancer qui avaient été précédemment identifiées dans une analyse pan-cancer [2]. Nous avons identifié en 2011 des événements de néojonction putatifs dans les protéines de surface cellulaire exprimées dans les GBM. Parmi ceux-ci, 37,8 % sont tombés dans les domaines extracellulaires et conviendraient donc comme cibles cellulaires CAR T (Fig. 2a). Nous avons ensuite comparé les données scRNA-seq du GBM humain (section « Matériaux et méthodes »), pour valider les séquences de néojonction comme étant exprimées dans les cellules néoplasiques, mais non exprimées dans les cellules gliales ou immunitaires non malignes (Fig. 2b). Nous avons trouvé une variété de néojonctions qui sont spécifiquement exprimées par les cellules néoplasiques GBM (Fichier supplémentaire 4 : Tableau S3). Ceux-ci comprenaient des récepteurs de la matrice extracellulaire longtemps étudiés comme médiateurs de l'invasion de GBM (par exemple, PTPRZ1 Fig. 2c) [5], ainsi que le marqueur des cellules souches de gliome du sous-type mésenchymateux de Verhaak, CD44. Nous avons trouvé plusieurs séquences cibles exprimées dans 10 à 35 % des cellules néoplasiques au sein de tumeurs individuelles et dans 5 à 10 % des cas de GBM (Fig. 2d, Fichier supplémentaire 3 : Fig. S2A).

une Les fréquences des néojonctions identifiées par Kahles et al. [2] à travers les domaines des protéines de surface cellulaire. b Les fréquences des néojonctions dans les domaines extracellulaires des protéines de surface cellulaire et dans les cellules néoplasiques par rapport aux cellules gliales, immunitaires et endothéliales non malignes. c Les fréquences d'expression des séquences de néojonction dans les cellules néoplasiques humaines GBM dans les données Smart-seq2 scRNA-seq. Les fréquences des néojonctions dans les populations de GBM et de pan-cancer, telles qu'évaluées à partir des données RNA-seq du Cancer Genome Atlas (TCGA)

Nous avons ensuite interrogé nos nouvelles données RNA-seq pour les événements de SA spécifiques à la tumeur. Nous avons identifié des gènes épissés de manière différentielle entre tous les échantillons de GBM par rapport aux échantillons de cerveau non malins (section « Matériels et méthodes » Fichier supplémentaire 5 : tableau S4). Ces événements ont ensuite été filtrés pour ne retenir que ceux qui étaient complètement absents dans le cerveau non malin. À cette fin, nous avons uniquement pris en compte les événements de SA avec PSI = 0 dans tous les échantillons de cerveau non malins et nous nous attendions à un PSI absolu > 10 % à un niveau de confiance de 95 % dans les échantillons de tumeur. Nous avons trouvé beaucoup moins d'événements spécifiques à la tumeur que dans notre précédente analyse d'épissage différentiel (Fig. 3a). Néanmoins, nous avons identifié 221 événements de SA spécifiques à la tumeur (Fig. 3b), la majorité survenant uniquement dans les GBM récurrents (Fichier supplémentaire 3 : Fig. S2B). Lorsque nous avons comparé nos données GBM scRNA-seq, nous avons trouvé qu'il y avait 21 et 18 événements de néojonction putatifs dans les protéines de surface cellulaire qui étaient spécifiquement exprimés dans les cellules néoplasiques et étaient présents dans les domaines extracellulaires (Fig. 3c, d Fichier supplémentaire 6 : Tableau S5 ). Suivant l'approche de Kahles et al. [2], nous avons dérivé des séquences polypeptidiques couvrant la néojonction et les avons comparées à la base de données du Clinical Proteomic Tumor Analysis Consortium (CPTAC) [6]. Nous avons constaté que plus de 75 % de nos échantillons exprimaient au moins une néojonction confirmée par CPTAC (Fig. 3e), avec trois à quatre néojonctions confirmées par échantillon en moyenne (Fig. 3f). Nous considérons qu'il s'agit d'une sous-estimation prudente car les polypeptides alternatifs dérivés de l'épissage sont mal représentés dans les données de spectrométrie de masse telles que CPTAC en raison des propriétés de clivage de la trypsine [7]. Ainsi, tous nos candidats au niveau de l'ARN conviendraient à une validation et à un développement ultérieurs en tant que cibles cellulaires CAR T.

une La distribution du type d'événement de SA dans les événements de SA spécifiques à la tumeur, en comparant les GBM primaires et récurrents. b Les fractions d'événements AS spécifiques à la tumeur dans les protéines de surface cellulaire, comparées entre le GBM primaire et récurrent. c Les pourcentages de néojonctions spécifiques à la tumeur trouvées dans différents domaines protéiques. Les fréquences des néojonctions spécifiques à la tumeur dans les cellules néoplasiques GBM de Smart-seq2 scRNA-seq. e Les fractions de cas avec au moins une néojonction confirmée par CPTAC. F Le nombre moyen de néojonctions confirmées par CPTAC par cas

Bien que notre objectif principal ait été l'identification de cibles pour les cellules CAR T, nous avons également criblé des cibles putatives pour les thérapies par cellules T transduites par le récepteur des cellules T (TCR). Les cellules TCR TCR sont moins flexibles que les cellules CAR T, en ce sens qu'elles nécessitent un traitement cible et une présentation sur l'antigène leucocytaire humain (HLA) de classe I. D'autre part, les cellules CAR T peuvent cibler n'importe quelle protéine de surface cellulaire indépendamment de la présentation HLA et le traitement des peptides n'est pas une condition préalable. Ainsi, pour identifier des cibles putatives pour la thérapie par cellules TCR TCR, nous devions d'abord déterminer le sérotype HLA de classe I pour chaque patient à partir des données RNA-seq associées (Fig. 4a section « Matériels et méthodes » Fichier supplémentaire 7 : Tableau S6) . Nous avons ensuite extrait les séquences de la référence dans une fenêtre de 50 paires de bases autour de chacune de nos néojonctions putatives et utilisé NetMHCpan pour prédire les peptides clivés à partir du produit protéique associé. NetMHCpan a également été utilisé pour prédire la liaison HLA des peptides générés, compte tenu du sérotype du patient. Nous avons identifié 704 néo-antigènes putatifs dérivés de la néojonction (Fig. 4b). Notez qu'une seule néojonction peut conduire à plusieurs néoantigènes putatifs. Nous avons observé une augmentation à la fois du nombre de néoantigènes déduits et de l'affinité de liaison prédite de ces antigènes dans les GBM récurrents (Fig. 4c, d).

une Un aperçu du pipeline de découverte de néoantigènes. b Le nombre de néo-antigènes putatifs dérivés de la néojonction enrichis en tumeurs primaires, enrichis en tumeurs récurrentes et partagés. c Les fréquences des néo-antigènes dérivés de la néojonction dans le GBM primaire vs récurrent. Le HLA-I a prédit les affinités de liaison des néoantigènes dérivés de la néojonction dans le GBM primaire vs récurrent

Événements AS enrichis en GBM récurrents

Ensuite, nous avons effectué un test PSI différentiel via MAJIQ, comparant les échantillons primaires et récurrents. Nous avons identifié 172 événements de SA dans 107 gènes (100 ARN codants et 7 longs ARN non codants) avec un PSI différentiel attendu supérieur à 10 %, au niveau de confiance de 95 % (section « Matériaux et méthodes » Fichier supplémentaire 8 : Tableau S7). Bon nombre de ces événements se sont produits dans des gènes essentiels à la progression maligne. Par exemple, plusieurs protéines kinases activées par les mitogènes (MAP4K4, MAPK9, MAPK10), les récepteurs du facteur de croissance (FGFR1, FGFR2, EGFR), et les protéines matricellulaires (TNC, FN1) ont montré des différences significatives de PSI entre le GBM primaire et récurrent (Fig. 5a, fichier supplémentaire 3 : Fig. S3A). Nous avons constaté que ceux-ci et d'autres AS qui étaient enrichis en GBM récurrents dans nos données étaient également enrichis dans les cas récurrents en GBM RNA-seq publiquement disponible [8] (Fig. 5b).

une Exemples d'événements AS avec un épissage différentiel significatif entre les GBM primaires et récurrents. b Les pourcentages de chevauchement entre les événements AS spécifiques récurrents dans nos données, par rapport à l'expression spécifique récurrente dans les données TCGA et INCB

Les GBM récurrents expriment préférentiellement des isoformes qui améliorent l'invasion

Les séquences de gènes épissés de manière différentielle ont été analysées à la recherche de motifs protéiques de liaison à l'ARN et de sites de liaison putatifs. La majorité des sites de liaison ont été trouvés dans les régions codantes, moins dans les régions non traduites et introniques (Fig. 6a). Parmi les motifs les plus fréquemment observés figuraient ceux reconnus par les trans-médiateurs précédemment décrits de la SA. En particulier, plusieurs protéines de liaison à l'ARN du facteur d'épissage riche en sérine et en arginine (SRSF) ont été identifiées (Fig. 6b). Les facteurs d'épissage SRSF ont déjà été impliqués dans la progression du cancer pour leur capacité à se lier à des exons variables et à inhiber ou promouvoir le saut d'exon (par exemple, [9]).

une La distribution des sites de reconnaissance des protéines de liaison à l'ARN à travers des gènes épissés de manière différentielle entre le GBM primaire et récurrent. b Les fréquences d'occurrences de motifs protéiques de liaison à l'ARN dans les gènes à épissage différentiel entre le GBM primaire et récurrent. c L'inclusion d'exons alternatifs dans MAP4K4. Sites de liaison inférés pour les protéines SRSF dans MAP4K4. e Valeurs PSI pour les jonctions supportant l'inclusion de l'exon 19 et autres, comparées entre l'ARN-seq du GBM primaire et récurrent, en utilisant les données internes. F Un péché e, mais en utilisant les données publiques de TCGA et INCB. g Les fréquences d'expression de l'exon-19 soutenant les séquences de néojonction dans le GBM primaire vs récurrent, comparées entre nos données internes, les données TCGA et INCB. h Les fréquences d'apparition de MAP4K4 jonctions d'exons soutenant l'inclusion de l'exon-19 dans les cellules néoplasiques GBM souches et non souches. je Les résultats d'un essai d'invasion de la matrice extracellulaire comparant SRSF5 OE dans des cellules U87 à des contrôles, avec et sans traitement TMZ à la CI50 pendant 48 h

Certains sites de liaison SRSF prédits se sont produits dans des exons qui ont été spécifiquement retenus dans le GBM récurrent. Par exemple, MAP4K4 interagit sélectivement avec MAPK8 pour favoriser la migration et l'invasion dans le cancer, en fonction de l'inclusion de l'exon 19 [10, 11]. Un récent écran de perte de fonction identifié MAP4K4 comme essentiel pour l'invasion de GBM et la transition épithéliale-mésenchymateuse [12]. Nous avons trouvé l'exon 19 de MAP4K4 à être préférentiellement retenu dans le GBM récurrent dans nos données, mais préférentiellement épissé dans le GBM primaire (Fig. 6c). De plus, les motifs SRSF5 et SRSF9 (deux des plus surreprésentés dans notre analyse) étaient enrichis en exon 19 (Fig. 6d). Cet enrichissement pour l'inclusion de l'exon 19 à la récidive a été prononcé dans nos données (Fig. 6e) et validé dans les données longitudinales publiques GBM RNA-seq [8], à la fois via la modélisation MAJIQ (Fig. 6f) et en termes de nombre de primaire vs cas récidivants exprimant la néojonction associée (Fig. 6g).

Pour déterminer la spécificité de type cellulaire de MAP4K4 expression des isoformes, nous avons passé au crible les données scRNA-seq publiées qui ont été obtenues via les plateformes Smart-seq2 et 10X Genomics [13, 14]. Nous avons trouvé une augmentation de plus de 2 fois des séquences de jonction supportant l'exon-19 dans les cellules souches par rapport aux cellules avec un phénotype plus différencié (Fig. 6h, fichier supplémentaire 3 : Fig. S3B section « Matériaux et méthodes »). De plus, cette isoforme a été trouvée principalement dans les cellules souches du sous-type mésenchymateux Verhaak. Conformément au rôle de cette isoforme dans la stimulation de MAPK8, nous avons trouvé une augmentation significative MAPK8 expression dans le GBM récurrent (adj. p = 0,045 Fichier supplémentaire 9 : Tableau S8).

Pour déterminer l'effet de SRSF5 surexpression (OE), nous avons transfecté la lignée cellulaire de gliome dérivée du patient U87 avec des plasmides exprimant SRSF5 ou des champs à vecteur vide (section "Matériaux et méthodes"). Les cellules transfectées ont été sélectionnées par cytométrie en flux à l'aide d'un marqueur fluorescent exprimé par le vecteur. 500 000 cellules par condition (en double) ont été aliquotées pour un essai d'invasion de matrice extracellulaire basé sur la chambre de Boyden. Nous avons considéré deux bras, avec et sans traitement de 48 heures avec le témozolomide (TMZ) de traitement standard du GBM à la moitié de la concentration maximale inhibitrice (CI50), que nous avions déterminée à partir d'études précédentes pour cette lignée cellulaire [14]. Nous avons trouvé que SRSF5 OE a augmenté le caractère invasif et que cet effet a été exacerbé par le traitement TMZ (Fig. 6i).


Discussion

Un atlas complet du transcriptome FL de l'arachide a été reconstruit à partir de tissus de racines, de feuilles, d'extrémités de pousses, de fleurs et de tissus de chevilles par PacBio Iso-seq. À l'aide des données Iso-seq, nous avons détecté plusieurs événements AS associés au tissu de cheville et aux transcrits FL spécifiques au stade de développement. Nous avons identifié 1448, 1102, 832 et 902 transcrits épissés alternativement dans l'arachide S1, S2, S3 et S4, respectivement, dont 184 transcrits épissés alternativement liés à la réponse lumineuse et mécanique, à la stimulation de la gravité, aux voies de signalisation à médiation hormonale et à la dépendance au calcium. protéines, qui étaient considérées comme jouant un rôle important dans le développement des chevilles d'arachide, comme l'allongement des chevilles et la formation précoce des gousses.

Les piquets S1 représentaient les piquets aériens fertilisés qui détectaient la gravité et se penchaient vers le bas. À ce stade, nous avons identifié plusieurs transcrits spécifiquement exprimés liés au stimulus lumineux et mécanique, à la stimulation de la gravité, aux facteurs de réponse hormonale et aux protéines kinases dépendantes du calcium et aux récepteurs de détection (tableau S5). Parmi ces transcrits, nous avons trouvé 21 transcrits liés au stimulus lumineux et mécanique, y compris la protéine associée au tri des protéines vacuolaires (9 transcrits), les protéines liées à la peroxydase (6 transcrits), la sous-unité ATPase du proton de type V (4 transcrits) et le cation vacuolaire. /échangeur de protons 5 (2 transcrits), qui ont joué un rôle clé dans l'allongement des chevilles d'arachide et le développement des gousses [4, 7, 9, 24]. Des études antérieures ont montré que les transporteurs ABC, les microtubules, les protéines associées aux microtubules et les protéines de choc thermique jouent un rôle important dans la réponse à la stimulation de la gravité des plantes [25,26,27]. Dans cette étude, nous avons identifié 20 transcrits spécifiquement exprimés liés à la stimulation de la gravité, dont 8 transcrits de transporteur ABC, 5 transcrits d'alpha-tubuline, 3 transcrits de protéines associées aux microtubules, deux transcrits de protéines de liaison aux microtubules TANGLED et deux petits transcrits de protéines de choc thermique. Notamment, deux gènes gravitropiques, RÉPONSE MODIFIÉE À LA GRAVITÉ (ARG1) et GRAVITROPISME DÉFECTUEUX 2 (GRV2), qui étaient bien caractérisés pour affecter la croissance des plantes en réponse à la gravité [28,29,30], ont été détectés chacun alternativement 2 isoformes et exprimés uniquement dans les chevilles S1. Il a été rapporté que la perception de la gravité pouvait donner lieu à une redistribution asymétrique de l'auxine et faire en sorte que les organes de la plante se courbent ou se développent vers un vecteur de gravité [31, 32]. Nous avons identifié 15 transcrits liés aux facteurs de réponse hormonaux, dont 7 facteurs de réponse à l'auxine, 2 protéines sensibles à l'auxine IAA26, 2 protéines de surproduction d'éthylène 1, 2 facteurs de transcription sensibles à l'éthylène RAP2-12 et 2 IAA-aminoacide hydrolase ILR1-like 6, qui ont été spécifiquement exprimés dans les chevilles S1. La réponse à la stimulation de la gravité pourrait augmenter le niveau de Ca 2+ du cytoplasme et favoriser davantage l'extensibilité de la paroi cellulaire, ce qui a modifié le transport polaire de l'auxine [33, 34]. Nous avons trouvé 6 transcrits spécifiquement exprimés liés aux protéines kinases dépendantes du calcium et aux récepteurs de détection, y compris le récepteur de détection du calcium (3 transcrits) et la protéine kinase dépendante du calcium (3 transcrits). Par exemple, nous avons identifié 14 transcrits liés à la structure de la paroi cellulaire, dont 10 villines, 2 polygalacturonases et 2 expansines. Les villines étaient impliquées dans la régulation de la dynamique de l'actine végétale, telle que la croissance des tubes polliniques et des poils absorbants [35, 36]. Les expansines jouent un rôle vital dans de multiples processus morphogénétiques, tels que l'allongement et l'extension de la paroi cellulaire des plantes, la croissance des tubes polliniques et des poils absorbants, la régulation de l'action de l'auxine [37, 38]. Nos résultats ont montré que les villines et les expansines peuvent contribuer à l'allongement des chevilles S1. Un autre gène, l'estérase/lipase de la GDSL, aurait des fonctions dans la régulation des composants de signalisation de l'éthylène pour moduler l'immunité systémique chez les Arabidopsis [39, 40], a été identifiée à 2 isoformes alternativement transcrites et exprimée uniquement dans les chevilles S1.

S2 représentait les piquets souterrains qui ont pénétré dans le sol pendant 24 h, qui présentaient des caractéristiques morphologiques et physiologiques différentes par rapport aux piquets S1. Nous avons identifié plusieurs transcrits épissés alternativement qui étaient spécifiquement exprimés dans les chevilles S2 (tableau S5), dont principalement liés au stimulus mécanique, à la stimulation de la gravité, au transporteur d'auxine et aux protéines, transporteurs et protéines kinases sensibles. Vingt-deux transcrits épissés alternativement liés à la stimulation de la gravité (10 transcrits) et au stimulus mécanique (12 transcrits) ont été spécifiquement exprimés dans les chevilles S2, suggérant que les transcrits ont contribué à l'allongement des chevilles d'arachide après pénétration dans le sol dans les 24 h. Un gène gravitropique, TIRER GRAVITROPISME 6 (SGR6), qui a été signalé comme étant impliqué dans la régulation des modifications des structures morphologiques et des membranes vacuolaires dans les cellules endodermiques sensibles à la gravité dans Arabidopsis [41], ont été identifiés comme ayant 3 isoformes par un événement AA et spécifiquement exprimés uniquement dans les chevilles S2. Une analyse plus approfondie a identifié 5 transcrits susceptibles d'être le transport de l'auxine et réactifs, dont 2 impliqués dans la protéine de type transporteur de l'auxine 4 et 3 dans la protéine sensible à l'auxine IAA30. Nous avons identifié plusieurs transcrits de transporteur spécifiquement exprimés dans les chevilles S2, y compris le transporteur GABA 1 (2 transcrits), le transporteur de magnésium NIPA6 (4 transcrits), le transporteur de sulfate 4.2 (4 transcrits), la protéine de transport de protéine Sec24-like At3g07100 (3 transcrits), le transporteur de sucre ERD6-like 6 (2 transcrits), le transporteur de dicarboxylate de tonoplaste (3 transcrits) et le transporteur de dicarboxylate de tonoplaste (2 transcrits), qui étaient cohérents avec une étude précédente sur le transcriptome de l'arachide [4]. Un grand nombre de transcrits codant pour les protéines sérine/thréonine protéine kinase ont été identifiés comme étant impliqués dans le froid, le stress salin et dans la régulation de la croissance et du développement des plantes par autophosphorylation [42, 43].

Les piquets S3, contrairement à S2, représentaient la réorientation des piquets souterrains contre la gravité après pénétration dans le sol pendant trois jours. Nous avons identifié de nombreux transcrits épissés de manière alternative liés à un stimulus mécanique, tels que les peroxydases, les récepteurs de tri vacuolaire et les ATPases protoniques de type V et de nombreuses protéines de réponse hormonale, c'est-à-dire des protéines réactives à l'auxine et à la surproduction d'éthylène, suggérant que ces transcrits jouent un rôle dans le sous-sol. développement des chevilles. Semblable aux chevilles S2, nous avons trouvé plusieurs transcrits liés aux protéines sérine/thréonine protéine kinase, en particulier pour la sérine/thréonine-protéine kinase de type récepteur LRR (10 transcrits) qui étaient impliqués dans la signalisation précoce de l'acide abscissique et agissaient comme un régulateur essentiel dans Arabidopsis formation de motifs embryonnaires et génération de primordiums de cotylédons [44,45,46]. Notamment, nous avons détecté de nombreux transcrits AS qui étaient impliqués dans la régulation du processus de développement dans les chevilles S3. Un gène, EMBRYON DÉFECTUEUX 1674 (EMB1674), avait deux isoformes en raison d'un événement AA, qui était impliqué dans la régulation du développement embryonnaire normal dans Arabidopsis [47]. Le gène PENTACYSTEINE DE BASE4 (BPC4), ayant deux isoformes comme événement AD, fonctionnait comme un régulateur transcriptionnel positif qui était impliqué dans les processus de développement chez Arabidopsis [48]. Un gène Protéine de formation racinaire aberrante 4 (ALF4), codant pour une protéine localisée dans le noyau, avait deux isoformes dues à un événement IR, qui jouent un rôle essentiel dans Arabidopsis formation de racines latérales [49]. Entre-temps, nous avons détecté certains gènes impliqués dans la régulation de la lumière du développement, par exemple, SÉQUENCE 5 LIÉE À FAR1 (FRS5), avait trois isoformes dues aux événements AD, AA et ES, qui fonctionnaient comme un activateur de la transcription impliquant la régulation du contrôle de la lumière du développement dans Arabidopsis [50] CHRONOMÈTRE CIRCADIEN XAP5 (XCT) avait deux isoformes grâce à un événement AA qui était impliqué dans la coordination des signaux lumineux pour la photomorphogenèse et l'horloge circadienne dans Arabidopsis [51].

S4 représentait une gousse souterraine subissant un gonflement et un allongement après pénétration dans le sol. Nous avons identifié 902 transcrits épissés alternativement dans les gousses S4. Parmi ces transcrits, nous avons détecté plusieurs transcrits liés au stimulus mécanique, aux protéines de réponse à l'auxine, aux protéines de liaison/transport du calcium, aux transports, aux protéines de cycline et aux régulateurs du processus de développement. Dix-sept transcrits liés au stimulus mécanique (8 transcrits) et aux protéines de liaison/transport du calcium (7 transcrits) ont été identifiés spécifiquement exprimés dans les premières gousses gonflées. Huit transcrits codant pour le facteur de réponse à l'auxine 3/4 et la protéine sensible à l'auxine IAA9 ont été spécifiquement exprimés dans les gousses S4, qui étaient impliquées dans la régulation de l'expression des gènes de réponse à l'auxine [52]. De multiples transcrits de transporteurs d'ions inorganiques et de petites substances organiques présentaient une expression unique dans les gousses S4. Un gène, protéine de transport de l'auxine BIG (BIG), codant pour une protéine de type calossine, avait deux isoformes dues à un événement AD, qui était impliqué dans le transport de l'auxine polaire lors de stimuli médiés par la lumière [53]. De nombreux transcrits d'AS codant pour des protéines de cycline ont été identifiés spécifiquement exprimés dans les premières gousses gonflées. Parmi ces protéines de cycline, Cycline-D4-1 (CYCD4-1) a agi comme activateur de Arabidopsis division de l'apex des racines et a favorisé la germination des graines [54]. En outre, nous avons identifié plusieurs transcrits spécifiquement exprimés liés aux régulateurs du processus de développement dans les gousses S4. Seven transcripts from gene TOPLESS (TPL) encoding transcriptional corepressor were identified uniquely expressed in early swelling pods, which were functioned as an essential factor in ovule development [55]. Notably, five transcripts from gene ROOT HAIR DEFECTIVE 3 (RHD3) encoding GTP-binding protein were identified in swelling pods, which was involved in root or root hair cells enlargement [56,57,58].


4. Alternative splicing and nonsense-mediated decay

NMD is an extensive and complicated mechanism, ranging from yeast to human, exploited to achieve another level of robustness in post-transcriptional gene expression control. Studies have revealed that up to one-third of human alternative splicing events contain premature termination codons (PTC), which are recognized and lead to the degradation of transcripts containing NMD cis-elements in their 3′ UTRs (56, 57). In vertebrates, it has been proposed that the coupling of the exon junction complex (EJC) to mRNA transcripts, followed by binding of 3′UTRs to EJCs, triggers vertebrate specific NMD (58). The sensitivity of mRNA transcripts to NMD is modulated by alternative splicing events in the 5′ or 3′UTRs and aids with the wide range of protein biosynthesis (59). Furthermore, analysis of quantitative alternative splicing microarray profiling has demonstrated that individual knockdown of NMD factors [Up-Frameshift (UPF)] strongly affects PTC-introducing alternative splicing events, indicating a role for different UPF factor requirements in alternative splicing regulation (60). In a second example, regulation of intron retention by alternative splicing-NMD in a specific differentiation event has been recently observed (61).


Contrôle de la stabilité de l'ARN

Before the mRNA leaves the nucleus, it is given two protective “caps” that prevent the ends of the strand from degrading during its journey. 5′ and 3′ exonucleases can degrade unprotected RNAs. Les 5′ cap , which is placed on the 5′ end of the mRNA, is usually composed of a methylated guanosine triphosphate molecule (GTP). The GTP is placed “backward” on the 5′ end of the mRNA, so that the 5′ carbons of the GTP and the terminal nucleotide are linked through three phosphates. Les queue poly-A , which is attached to the 3′ end, is usually composed of a long chain of adenine nucleotides. Ces changements protègent les deux extrémités de l'ARN de l'attaque des exonucléases.

Une fois que l'ARN est transporté vers le cytoplasme, la durée pendant laquelle l'ARN y réside peut être contrôlée. Chaque molécule d'ARN a une durée de vie définie et se désintègre à une vitesse spécifique. Ce taux de décomposition peut influencer la quantité de protéines dans la cellule. Si le taux de décroissance augmente, l'ARN n'existera pas dans le cytoplasme aussi longtemps, ce qui raccourcira le temps disponible pour que la traduction de l'ARNm se produise. Inversement, si le taux de dégradation est diminué, la molécule d'ARNm résidera plus longtemps dans le cytoplasme et plus de protéines pourront être traduites. Ce taux de dégradation est appelé stabilité de l'ARN. Si l'ARN est stable, il sera détecté plus longtemps dans le cytoplasme.

La liaison des protéines à l'ARN peut également influencer sa stabilité. Proteins called RNA-binding proteins , or RBPs, can bind to the regions of the mRNA just upstream or downstream of the protein-coding region. These regions in the RNA that are not translated into protein are called the untranslated regions , or UTRs. Ce ne sont pas des introns (ceux-ci ont été supprimés dans le noyau). Ce sont plutôt des régions qui régulent la localisation, la stabilité et la traduction des protéines de l'ARNm. The region just before the protein-coding region is called the 5′ UTR , whereas the region after the coding region is called the 3′ UTR (Figure 3). La liaison des RBP à ces régions peut augmenter ou diminuer la stabilité d'une molécule d'ARN, en fonction de la RBP spécifique qui se lie.

Figure 3. The protein-coding region of mRNA is flanked by 5′ and 3′ untranslated regions (UTRs). The presence of RNA-binding proteins at the 5′ or 3′ UTR influences the stability of the RNA molecule.


Possibilités d'accès

Obtenez un accès complet au journal pendant 1 an

Tous les prix sont des prix NET.
La TVA sera ajoutée plus tard dans la caisse.
Le calcul des taxes sera finalisé lors du paiement.

Obtenez un accès limité ou complet aux articles sur ReadCube.

Tous les prix sont des prix NET.


Download and print this article for your personal scholarly, research, and educational use.

Buy a single issue of Science for just $15 USD.

Science

Vol 351, Issue 6280
25 March 2016

Article Tools

Please log in to add an alert for this article.

Science 25 Mar 2016 : 1390-1392

3D snapshots reveal dynamics of the spliceosome on the mRNA splicing pathway [Also see Research Article by Agafonov et al.]


Evolution: Alternative splicing of RNA rewires signaling in different tissues, may contribute to species differences

MIT biologists have found that alternative splicing of messenger RNA accounts for much of the differences seen between species. Credit: Wikimedia Commons

When genes were first discovered, the canonical view was that each gene encodes a unique protein. However, biologists later found that segments of genes can be combined in different ways, giving rise to many different proteins.

This phenomenon, known as alternative RNA splicing, often alters the outputs of signaling networks in different tissues and may contribute disproportionately to differences between species, according to a new study from MIT biologists.

After analyzing vast amounts of genetic data, the researchers found that the same genes are expressed in the same tissue types, such as liver or heart, across mammalian species. However, alternative splicing patterns—which determine the segments of those genes included or excluded—vary from species to species.

"The core things that make a heart a heart are mostly determined by a heart-specific gene expression signature. But the core things that make a mouse a mouse may disproportionately derive from splicing patterns that differ from those of rats or other mammals" says Chris Burge, an MIT professor of biology and biological engineering, and senior author of a paper on the findings in the Dec. 20 online edition of Science.

Lead author of the paper is MIT biology graduate student Jason Merkin. Other authors are Caitlin Russell, a former technician in Burge's lab, and Ping Chen, a visiting grad student at MIT.

A variety of proteins

Alternative RNA splicing (a discovery for which MIT Institute Professor Phillip Sharp shared the 1993 Nobel Prize in medicine or physiology), controls the composition of proteins encoded by a gene. In mammals, genes—made of DNA stored in the cell nucleus—consist of many short segments known as exons and introns. After the DNA is copied into an RNA transcript, all introns and frequently some exons are excised before the messenger RNA (mRNA) leaves the nucleus, carrying instructions to make a specific protein.

This process allows cells to create a much wider variety of proteins than would be possible if each gene encoded only one protein. Some proteins, including Dscam in fruit flies and neurexin in humans, have thousands of alternate forms. These variant proteins can have vastly different functions, Burge says. For example, the full version of a protein may bind to DNA at one end and activate DNA transcription at the other end. If an alternatively spliced form is missing the activation section, it will compete for binding to the same DNA regions as the full-length protein, preventing activation of transcription.

In 2008, Burge and colleagues analyzed mRNA from 10 different human tissues, publishing their results in La nature, and found that nearly every gene is alternatively spliced. Furthermore, most alternative splicing was found to differ among tissues.

In the new study, the researchers compared tissues from several different mammalian species—the rhesus monkey, rat, mouse and cow—as well as one species of bird, the chicken. For each species, the researchers analyzed nine types of tissue (brain, colon, heart, kidney, liver, lung, muscle, spleen and testes) from three individuals, sequencing more than a trillion bases of mRNA.

Using new high-speed sequencing technology, the researchers analyzed both gene expression and alternative splicing patterns in each tissue sample. They found that gene expression patterns were extremely similar across tissues, no matter what species the tissue came from. That is, the genes active in kidney tissue from rats were nearly identical to those turned on in cows' kidney tissue.

"That was not a big surprise," Burge says. "It's consistent with the idea that the gene expression pattern actually determines the identify of the tissue. You need to express certain structural and motor proteins if you're a muscle cell, and if you're a neuron you have to express certain synaptic proteins."

The results from the alternative splicing pattern comparison were very different. Instead of clustering by tissue, the patterns clustered mostly by species. "Different tissues from the cow look more like the other cow tissues, in terms of splicing, than they do like the corresponding tissue in mouse or rat or rhesus," Burge says.

Because splicing patterns are more specific to each species, it appears that splicing may contribute preferentially to differences between those species, Burge says. "Splicing seems to be more malleable over shorter evolutionary timescales, and may contribute to making species different from one another and helping them adapt in various ways," he says.

The new study is the first large-scale effort to look at the role of alternative splicing in evolution, says Brenton Graveley, a professor of genetics and developmental biology at the University of Connecticut Health Center. "It provides a lot of new insight into the potential role of alternative splicing in driving differences between species," says Graveley, who was not involved in this study.

The researchers also found that a major function of alternative splicing is the addition and deletion of short protein segments that contain one or more phosphorylation sites. Phosphorylation (addition of a phosphate molecule) is a very common way for cells to activate or deactivate proteins.

When a variant form of a protein lacks a key phosphorylation site, it may lose the function of the original form. Phosphorylation can also direct proteins to different locations within the cell, which may alter their function.

Changes in splicing patterns also help to modify the signaling networks that regulate most cellular activity. These networks are often controlled by phosphorylation of proteins involved in the network, many of which can be alternatively spliced. "You can think about it as rewiring signaling networks so they control different outputs. Splicing can add a new output or delete it in a tissue-specific way," Burge says.

The researchers also identified several thousand new alternative exons in each species, and are now studying how these exons evolved and exploring their potential functions.

ABSTRACT
Most mammalian genes produce multiple distinct messenger RNAs through alternative splicing, but the extent of splicing conservation is not clear. To assess tissue-specific transcriptome variation across mammals, we sequenced complementary DNA from nine tissues from four mammals and one bird in biological triplicate, at unprecedented depth. We find that while tissue-specific gene expression programs are largely conserved, alternative splicing is well conserved in only a subset of tissues and is frequently lineage-specific. Thousands of previously unknown, lineage-specific, and conserved alternative exons were identified widely conserved alternative exons had signatures of binding by MBNL, PTB, RBFOX, STAR, and TIA family splicing factors, implicating them as ancestral mammalian splicing regulators. Our data also indicate that alternative splicing often alters protein phosphorylatability, delimiting the scope of kinase signaling.



Commentaires:

  1. Oakden

    la phrase excellente et est opportune

  2. Onur

    Je risque de paraître le profane, mais je demanderai quand même, d'où cela et qui en général a écrit ?

  3. Ethelred

    Phrase très intéressante

  4. Mayer

    Ce n'est pas exactement ce dont j'ai besoin. Il y a d'autres options?

  5. Abdul-Khaliq

    Est venu sur le forum et a vu ce sujet. Laissez vous aider?

  6. Naalyehe Ya Sidahi

    Je trouve que tu n'as pas raison. Je suis sûr. Ecrivez en MP, on en reparlera.

  7. Fergus

    Balin, wow ... :(



Écrire un message