Informations

Transcriptions les plus longues sans isoformes

Transcriptions les plus longues sans isoformes


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Est-ce que quelqu'un sait quels gènes produisent les ARNm les plus longs ? Je prévois un projet sur les introns synthétiques et souhaite utiliser des fragments de bourrage pour faire varier la taille des introns. Évidemment, ils ne doivent pas contenir de sites d'épissage, j'envisage donc d'acheter des clones d'ADNc.

Ce serait incroyablement apprécié si quelqu'un pouvait pointer du doigt des transcriptions de 12 à 20 kpb (et idéalement n'avoir aucune autre isoforme connue ou site d'épissage cryptique).

Merci!


À R !

  1. Téléchargez le fichier GTF le plus complet de Gencode pour souris.
  2. Faites ce qui suit dans R (je mettrai des commentaires dans le code afin que vous puissiez, espérons-le, suivre):
library(GenomicFeatures) #Charger le fichier GTF et créer un objet TxDb txdb = makeTxDbFromGFF("gencode.vM13.annotation.gtf", format="gtf") #Créer une GRangesList, avec des transcriptions divisées par gène grl = transcriptsBy(txdb, by="gene") # Filtrer la GRangesList pour les gènes avec une isoforme annotée grl2 = grl[which(elementNROWS(grl) == 1)] # Faire une nouvelle GRangesList des exons par gène d'en haut grl = exonsBy(txdb, par ="gene") grl = grl[which(names(grl) %in% singleIsoformGenes)] # Obtenez la longueur de chaque lentille de gène à isoforme unique = sum(width(grl)) # Obtenez les 10 principaux gènes d'isoformes simples par longueur head(lentille[ordre(lentille, décroissante=T)], n=10)

Vous obtenez ensuite la sortie suivante, avec les identifiants de gènes en haut et les longueurs en dessous :

ENSMUSG00000020255.8 ENSMUSG00000101609.1 ENSMUSG00000104211.1 123179 84395 74456 ENSMUSG00000109536.1 ENSMUSG00000109125.1 ENSMUSG00000047888.9 30942 25241 17327 ENSMUSG00000022262.7 ENSMUSG00000006108.7 ENSMUSG00000066108.7 ENSMUSG00000033826.9 30942 25241 17327 ENSMUSG00000022262.7 ENSMUSG000000066108.7 ENSMUSG00000033826.9

NCBI RefSeq Sélectionner

L'ensemble de données RefSeq Select se compose d'un transcrit représentatif ou « Select » pour chaque gène codant pour une protéine. Le transcrit est choisi par un pipeline automatisé basé sur plusieurs critères de sélection, qui incluent une utilisation antérieure dans des bases de données cliniques (par exemple, Locus Reference Genomic), l'expression du transcrit, la conservation de la région codante, la longueur du transcrit et de la protéine et la concordance avec le canonique Swiss-Prot. isoforme. Le transcrit RefSeq Select est généralement bien étayé par des données archivées, bien exprimées, conservées et représente la biologie du gène.


Fond

Les plantes subissent une exposition constante à des stress environnementaux très variables au cours de leur cycle de vie, le stress salin représentant la principale contrainte à la croissance et à la productivité, responsable de la qualité et du rendement [1]. En général, la salinité interfère avec la croissance des plantes car elle impose deux stress principaux aux plantes : la pression hyperosmotique, résultant de la faible disponibilité en eau, et la toxicité ionique (principalement Na + ), résultant des déséquilibres des solutés [2]. Pour que les plantes survivent dans ces conditions de stress, elles utiliseront des mécanismes de défense complexes à travers une série de changements physiologiques et biochimiques drastiques [3]. Ces modifications incluent le maintien de l'intégrité de la membrane cellulaire, la régulation de l'équilibre hydrique, le piégeage des espèces réactives de l'oxygène (ROS) et l'accumulation de solutés compatibles, ainsi que le rétablissement de l'équilibre ionique cellulaire [4], qui sont tous dédiés à la réduction des dommages osmotiques ou ioniques. causée par la salinité.

Les réponses physiologiques des plantes s'acclimatant à des environnements défavorables sont toutes initiées lors de l'activation de cascades de réseaux moléculaires au sein des voies de signalisation [5]. Dans les voies de signalisation, un niveau de salinité élevé déclenche souvent une augmentation du Ca 2+ cytosolique, des ROS et de l'ABA, qui sont des composants essentiels de la transduction du signal [6]. Les cascades de signalisation Ca 2+ , ROS et ABA activées modifient davantage les transcriptomes des plantes en régulant les facteurs de transcription en aval (TF), tels que les AP2-EREBP, les MYB et les bHLH. Par la suite, ces TF peuvent provoquer des changements dans l'expression de divers gènes de réponse au stress osmotique, tels que P5CS et COR15As, et des gènes ioniques sensibles au stress, tels que NHX et HKT, qui contribuent finalement à la tolérance à la salinité des plantes [7, 8]. Récemment, plusieurs voies de signalisation bien caractérisées des plantes répondant au stress de salinité ont été révélées, telles que la voie de la protéine kinase dépendante du calcium (CDPK), qui joue un rôle essentiel dans la réponse au stress osmotique [9] la voie du sel trop sensible (SOS) , qui est activé par les pointes de Ca 2+ du cytoplasme et surmonte les dommages ioniques en maintenant l'homéostasie cellulaire des ions [10] et le module des protéines de type calcineurine B-protéines kinases interagissant avec les CBL (CBL-CIPK), qui est essentiel pour lutter à la fois stress osmotique et ionique [11]. Malgré les progrès qui ont été réalisés dans le détail de ces processus, les mécanismes sous-jacents de la réponse des plantes à la salinité doivent être explorés plus avant, en particulier dans les plantes non modèles.

Luzerne (Médicament sativa L.), est la légumineuse fourragère pérenne la plus cultivée, et plus de 40 millions d'hectares sont plantés dans le monde [12]. Cette espèce est appelée la « reine des fourrages » et est utilisée comme foin, ensilage et pâturage pour les ruminants et la production laitière [13]. De plus, la luzerne possède un potentiel considérable en tant que matière première de biocarburant pour la production d'éthanol [14]. En Chine, les zones de plantation de luzerne sont principalement réparties dans les régions du nord, du nord-ouest et du nord-est [15]. Malheureusement, la salinisation des sols augmente considérablement dans ces régions, ce qui limite considérablement la productivité et la persistance de la luzerne [16]. Il est donc impératif de réaliser des études sur les mécanismes moléculaires d'adaptation au stress salin chez la luzerne.

Des études antérieures ont montré que la surexpression des gènes associés au stress codant pour le soluté compatible AgcodA [17], transporteur d'ions SeNHX1 [18], protéine kinase Au NDPK2 [19], ou TF GmDREB1 [20] et GsWRKY20 [21] améliore la tolérance au stress salin chez la luzerne. Compte tenu des caractéristiques de débit relativement faible des approches génétiques, les gènes potentiels à grande échelle impliqués dans les réponses de la luzerne aux stimuli défavorables de la salinité ont été étudiés via des technologies de séquençage de nouvelle génération (NGS). Postnikova et al. (2013) ont effectué le profilage transcriptionnel de racines entières de luzerne sous stress NaCl pendant 7 jours dans deux germoplasmes distincts tolérants à la salinité. ]. Lei et al. (2018) ont analysé comparativement les transcriptomes foliaires sous stress NaCl pendant 7 jours entre deux cultivars de luzerne tolérants à la salinité différents, ce qui a révélé que les interactions avec les hormones végétales sont un régulateur essentiel de la luzerne pour maintenir un statut physiologique spécifique pour l'adaptation au stress de salinité [23]. De plus, une analyse transcriptionnelle de novo de plantules de luzerne entières traitées avec des solutions salines-alcalines pendant 0, 1 et 7 jours a indiqué que la capacité antioxydante était l'un des mécanismes centraux sous-jacents à la tolérance au stress salin-alcalin de la luzerne [24]. Cependant, ces études se sont principalement concentrées sur des mécanismes de tolérance à la salinité spécifiques au génotype ou des mécanismes de tolérance salin-alcalins plus complexes, le consensus systématique sur les dommages comparatifs causés par les stress osmotique versus ionique lorsque la luzerne est soumise à la salinité fait encore défaut. Et aussi, même avec ces méthodes NGS basées sur la transcription, l'inconvénient était clair, comme la courte durée des lectures de séquençage, ce qui entrave considérablement sa capacité à estimer l'abondance des transcrits à l'échelle du génome.

Heureusement, la technologie de séquençage de troisième génération PacBio RSII peut surmonter ces limitations. Par rapport aux technologies NGS traditionnelles, cette technologie réalise le séquençage des isoformes en temps réel (SMRT) (Iso-Seq) avec de longues longueurs de lecture, une couverture uniforme et une grande précision, ce qui rend PacBio RSII très efficace pour capturer le catalogue complet des transcrits et constructions d'un transcriptome complet pour les espèces sans séquence génomique [25]. De plus, RNA-Seq basé sur la plate-forme BGISEQ-500 a été appliqué à des comparaisons d'expression génique de différentes espèces, stades de développement et stress [26, 27]. Actuellement, à notre connaissance, l'analyse transcriptomique à l'échelle du génome des gènes sensibles à la salinité n'a pas été rapportée dans les extrémités des racines de luzerne, où est le site principal de perception de la pression hyperosmotique et de la toxicité ionique [28, 29]. Ainsi, pour la première fois, nous avons appliqué le protocole Iso-Seq pour générer un transcriptome de référence complet pour les pointes de racines de luzerne lors de traitements continus au NaCl (un stresseur iso-osmotique) et au mannitol (un stresseur osmotique non ionique), puis nous avons effectué une comparaison d'expression génique pour les mêmes échantillons stressés à l'échelle transcriptionnelle en utilisant BGISEQ-500 RNA-Seq. De plus, les effets physiologiques des traitements au NaCl et au mannitol sur l'accumulation de ROS et les dommages cellulaires, ainsi que les réponses antioxydantes et osmoprotectrices sous-jacentes, ont été déterminés. Les résultats de cette étude nous aideront à comprendre la contribution des deux composantes osmotique et ionique à la tolérance à la salinité de la luzerne.


Introduction

L'analyse des transcriptomes, qui représentent l'activité des gènes dans le génome, est essentielle pour comprendre la relation entre génotype et phénotype. La dynamique et la complexité du transcriptome régulent tous les aspects de la croissance, du développement et des réponses des plantes à divers signaux biotiques et abiotiques externes. Différentes méthodes telles que le séquençage de l'étiquette de séquence exprimée (EST) (Wu et al., 2002), l'analyse en série de l'expression des gènes (SAGE) (Matsumura et al., 1999), la puce à ADN (Hihara et al., 2001), et récemment Le séquençage de l'ARN (RNA-Seq) utilisant des technologies de séquençage de nouvelle génération (NGS) (Mortazavi et al., 2008) a été développé pour analyser les transcriptomes. Depuis 2005, les plates-formes de séquençage à lecture courte de deuxième génération ont rapidement remplacé la technologie de séquençage Sanger de première génération pour diverses applications à haut débit en raison de coûts inférieurs et d'une plus grande profondeur de séquençage (Sedlazeck et al., 2018). Cependant, la longueur de lecture est la principale limitation du séquençage de lecture courte de deuxième génération, ce qui a rendu plus difficile l'analyse de plusieurs aspects des événements de traitement co/post-transcriptionnel. Pour surmonter cette limitation, au cours des dernières années, les chercheurs ont séquencé des transcrits complets en utilisant principalement deux plates-formes, Pacific BioSciences (PacBio) (Rhoads et Au, 2015) et Oxford Nanopore Technologies (ONT) (Bayega et al., 2018) , qui sont respectivement appelées technologies de séquençage de “troisième” et “quatrième” (Slatko et al., 2018). Ces deux plates-formes ont considérablement augmenté la longueur de lecture par rapport aux autres méthodes NGS et peuvent donc être utilisées pour répondre à une plus grande variété de questions de recherche. Le séquençage d'isoformes en temps réel à molécule unique (SMRT) (Iso-Seq) à l'aide de la plate-forme PacBio capture toute la longueur des transcrits (Gonzalez-Garay, 2016) et présente ainsi des moyens plus faciles et plus précis pour différentes applications, telles que l'annotation de gènes (Zhao et al., 2018), l'identification des isoformes (Abdel-Ghany et al., 2016 Wang T. et al., 2017), l'identification des transcrits de fusion (Weirather et al., 2015) et l'ARN long non codant (lncRNA) découverte (Li et al., 2016). Ici, nous discutons des applications et de l'utilité plus large de PacBio et de l'ONT dans les études du transcriptome. L'ARN-Seq direct récemment développé à l'aide de nanopore peut éviter les biais d'amplification (Garalde et al., 2018). De plus, cette technologie a le potentiel de fournir une vue complète des modifications de l'ARN telles que la N 6 -méthyladénosine, la 5-méthylcytidine et la 5-hydroxylméthylcytidine (Li X. et al., 2017), qui sont collectivement appelées le &# x201Cepitranscriptome.”

Certaines parties de l'algorithme de base pour les analyses à lecture longue PacBio et ONT sont similaires aux stratégies d'analyse à lecture courte utilisées dans les approches de séquençage de deuxième génération. Néanmoins, de nouveaux outils bioinformatiques spécifiques ont été conçus pour plusieurs des applications, qui ne faisaient pas partie des pipelines de séquençage de deuxième génération. Ces outils sont nécessaires pour offrir une plus grande flexibilité pour atteindre différents objectifs ainsi que pour résoudre de nouveaux problèmes, tels que des taux d'erreur plus élevés et un faible débit. Nous présentons les méthodes bioinformatiques actuellement disponibles pour l'analyse des lectures PacBio et ONT, y compris l'extraction des lectures d'intérêt (ROI), la correction d'erreurs (Au et al., 2012), la cartographie (Wu et Watanabe, 2005), le regroupement d'isoformes (Fu et al. ., 2012) et l'identification de plusieurs isoformes de transcription (Abdel-Ghany et al., 2016). Les améliorations apportées à ces nouvelles méthodes et pipelines de calcul élargiront le paysage de la complexité du transcriptome au niveau de l'isoforme du transcrit et de l'épitranscriptome avec un débit et une précision plus élevés. Ici, nous avons discuté des méthodologies PacBio Iso-Seq et ONT direct RNA-Seq, l'état actuel des outils bioinformatiques utilisés pour analyser les lectures longues et mis en évidence diverses applications de ces méthodes.


Discussion

Ici, nous montrons un raccourcissement généralisé de 3'UTR par APA dans la spermatogenèse, les 3'UTR étant les plus courtes dans les spermatides. Bien que ce mécanisme semble être général, certains gènes ont tendance à être plus régulés que d'autres. Les gènes spécifiques aux testicules présentent un raccourcissement 3'UTR plus important que les gènes exprimés de manière ubiquitaire, soulignant l'importance de ce mécanisme pour la spermatogenèse. Fait intéressant, l'ubiquitination des protéines est la voie la plus importante associée aux gènes avec un raccourcissement 3'UTR. En raison de l'importance de l'ubiquitination pour le développement des spermatozoïdes après les spermatides, comme l'élimination des nucléosomes et le remodelage de la structure cellulaire, nous postulons que le raccourcissement 3'UTR joue un rôle important pour la spermiogenèse. D'autres études expérimentales sont nécessaires pour confirmer cette hypothèse.

En utilisant des gènes sans APA comme groupe témoin, nous révélons que les éléments 3'UTR jouent un rôle important dans l'abondance de l'ARNm au cours de la spermatogenèse, y compris les éléments riches en U, en UA et en UG, éventuellement par la régulation de la stabilité de l'ARNm. Cela peut être important pour l'élimination des ARNm avant les spermatozoïdes, qui contiennent peu d'ARNm [61]. De futures études sont nécessaires pour élucider les protéines impliquées dans la dégradation de l'ARNm médiée par ces éléments cis. Une autre question importante à traiter est de savoir dans quelle mesure l'APA joue un rôle pour aider les transcriptions à éviter la dégradation. Par rapport aux transcrits sUTR, les isoformes longues 3'UTR ont diminué en expression de

1,7 fois de 2 semaines à 4 semaines et les isoformes courtes ont augmenté d'environ 2,1 fois au cours de la même période (Fichier supplémentaire 1 : Figure S7). En supposant que les isoformes longues aient des taux de dégradation similaires à ceux des transcrits sUTR, leur diminution d'expression peut être attribuable aux modifications de l'APA. Par conséquent, alors que de futures expériences sont nécessaires pour répondre précisément à la question, notre analyse indique un impact significatif sur la stabilité de l'ARNm par le biais des modifications de l'APA. Dans le même ordre d'idée, notre résultat d'analyse des éléments cis peut expliquer avec parcimonie pourquoi certains gènes présentent un allongement de 3'UTR alors que la tendance globale est au raccourcissement : pour les gènes dont les cUTR sont enrichis en éléments déstabilisants, leurs isoformes courtes 3'UTR sont moins stables que les longues isoforme, qui contient vraisemblablement des éléments stabilisants supplémentaires dans l'aUTR pour annuler l'effet déstabilisant de cUTR, conduisant à l'affichage global d'un allongement de 3'UTR.

En analysant les isoformes APA contenant des TE à différentes parties de 3'UTR, nous avons corroboré la récente découverte de Gou et al. [45] que les TE 3'UTR sont ciblés pour la dégradation de la spermatogenèse. En utilisant les données d'expression génique de souris Miwi−/− [44], nous avons en outre constaté que la dégradation se fait par la voie piRNA-Miwi. Ainsi, le raccourcissement 3'UTR peut aider les gènes à échapper à l'élimination de l'ARNm basée sur TE/piRNA/Miwi au cours de la spermatogenèse. Des études antérieures ont montré que les TE dans les 3'UTR peuvent jouer un rôle régulateur pour le métabolisme des ARNm [62-64] et que certains TE peuvent conférer des pA fonctionnels au gène hôte [65]. La régulation de l'APA dans la spermatogenèse peut ainsi permettre efficacement l'évolution des TE dans les 3'UTR sans inhiber l'expression des gènes de l'hôte, contribuant à l'exaptation des TE dans les 3'UTR. D'autres études sont nécessaires pour élucider l'importance de ce mécanisme pour l'évolution de 3'UTR. Il faut également examiner si certaines séquences d'aUTR contenant du TE peuvent donner naissance à des piARN, qui à leur tour régulent le gène hôte de manière post-transcriptionnelle.

Nous avons constaté que le raccourcissement de 3'UTR est couplé à une régulation à la hausse de la transcription des gènes et à l'état ouvert de la chromatine, comme indiqué par les niveaux RNAPII et H3K4me3, respectivement. Il a été suggéré que la chromatine ouverte provoque une transcription généralisée dans les testicules [30], conduisant à une grande complexité du transcriptome. Bien que ce résultat soit cohérent avec notre découverte précédente impliquant un rôle de l'activité transcriptionnelle dans la régulation de l'APA [53], le mécanisme derrière le couplage n'est pas clair. Une possibilité est que la structure permissive de la chromatine rend plus efficace l'assemblage de la machinerie de clivage/polyadénylation, conduisant à une plus grande utilisation des pA proximaux. Cependant, d'autres mécanismes impliquant des facteurs spécifiques pour faciliter le recrutement de la machinerie C/P, comme celui médié par les facteurs de transcription [66], ne peuvent être exclus.

Une régulation généralisée des événements APA dans les introns et les exons internes suggère une modulation de l'activité d'épissage au cours de la spermatogenèse, ce qui est cohérent avec les rapports précédents [31, 34-37]. Notamment, la régulation CDS-APA entre 3 et 4 semaines rappelle la régulation de l'APA par l'inhibition de U1 snRNP [26, 27], où l'activation de pAs est largement biaisée vers les introns 5'. S'il y a une pénurie localisée de U1 snRNP pour certains gènes conduisant à l'activation des pA introniques doit être examiné à l'avenir. Fait intéressant, les gènes avec des isoformes CDS-APA supprimées ont tendance à être régulés positivement dans l'expression (Fig. 7e) et ont des niveaux de H3K4me3 plus élevés (Fig. 7f), suggérant que l'état ouvert de la chromatine peut conduire à un épissage efficace, entraînant une inhibition du C/P intronique. .

Nous avons trouvé une activation globale des uaRNAs au cours de la spermatogenèse (Fig. 8). Ces transcrits non codants sont générés par des promoteurs divergents et sont typiquement sous la surveillance de l'exosome [26, 29]. Leur expression peut enrichir significativement le transcriptome au cours de la spermatogenèse, impactant potentiellement l'évolution de nouveaux gènes [67]. L'expression de l'uaRNA semble être associée à la chromatine ouverte autour du TSS et est en corrélation avec l'expression des transcrits sens. On ne sait cependant pas pourquoi ils ne sont pas éliminés par l'exosome nucléaire. La question de savoir si la fonction de l'exosome est supprimée dans la spermatogenèse ou est submergée par une activation substantielle de l'expression de l'uaRNA doit être abordée à l'avenir.


Conclusion

Ce travail représente la première étude complète des réseaux de régulation découverts pour une nouvelle classe d'ARNnc-vlincARN. Les réseaux ont été initialement obtenus à l'aide de l'analyse de co-expression basée sur le profilage du transcriptome SMS, puis validés à l'aide de deux approches différentes. Cette approche de validation croisée a confirmé l'authenticité de ces réseaux régulateurs d'ARNnc et a assuré la validité des principales conclusions suivantes dérivées de l'analyse de ces réseaux. Premièrement, un vlincRNA typique semble fonctionner en régulant l'expression de plusieurs gènes dans cis et trans. Deuxièmement, un vlincRNA peut avoir des effets à la fois positifs et négatifs sur l'expression de différents gènes cibles. Troisièmement, les vlincRNA ont tendance à réguler les gènes codant pour certaines fonctions liées notamment au traitement de l'ARN, au cycle cellulaire, au développement et à l'adhésion. Quatrièmement, la régulation dépend d'un mécanisme basé sur la co-localisation, mais pas nécessairement l'interaction directe, des vlincRNA et de leurs gènes cibles dans le noyau. À cet égard, deux autres lncRNA bien caractérisés NEAT1 et MALAT1 montrent un mode de régulation similaire. Il est donc tentant de spéculer que la régulation de plusieurs gènes via la proximité dans le noyau pourrait être un mode courant de fonctionnalité de l'ARNnc. De plus, le knockdown ciblé de 2 vlincRNAs dans des lignées cellulaires stables a révélé l'importance biologique de ces transcrits et de leurs réseaux régulateurs dans la survie en réponse au stress génotoxique au moins au niveau des cellules cultivées similaires aux résultats obtenus précédemment par notre groupe dans un écran de débit [22]. Cependant, des études supplémentaires sont nécessaires pour examiner la fonctionnalité des vlincRNAs et des lncRNAs en général, au niveau de l'organisme [12].


CONCLUSION

Les cellules souches somatiques humaines, les cellules tumorales somatiques et certaines cellules adultes peuvent en effet exprimer l'ARNm d'OCT4A à un niveau basal, par rapport aux cellules pluripotentes. Néanmoins, la protéine fonctionnelle d'OCT4A n'a pas été détectée de manière fiable dans les cellules non pluripotentes. Il n'est pas clair si l'expression au niveau basal d'OCT4A est encore dotée d'autres fonctions biologiques dans les cellules non pluripotentes. Cependant, l'expression de haut niveau de la protéine OCT4A reste une propriété des cellules pluripotentes.

OCT4B est exprimé à de faibles niveaux dans les cellules souches somatiques humaines, les cellules tumorales, les tissus adultes, ainsi que les cellules pluripotentes. Il est possible que OCT4B ait des fonctions diverses dans différentes cellules par divers produits protéiques. OCT4B est susceptible de jouer un rôle dans la réponse au stress [ 20 ], et une caractérisation biologique plus détaillée de l'OCT4B devrait être explorée à l'avenir. Il est intéressant de noter que l'OCT4B1 peut être lié à la souche [11, 21], et les recherches sur l'OCT4B1 contribueraient à la recherche sur les cellules souches.

Chaque isoforme de OCT4 révèle une séquence distincte, ainsi OCT4A, OCT4B et OCT4B1 peuvent contenir différents éléments régulateurs d'ARN. Peut-être, OCT4 les isoformes peuvent utiliser différents éléments promoteurs et amplificateurs pour leur transcription. Par conséquent, OCT4 les isoformes pourraient être régulées respectivement dans les mêmes conditions. Cependant, il est possible que les isoformes protéiques de OCT4 peuvent avoir des liens étroits les uns avec les autres dans les fonctions biologiques en raison de la séquence commune qu'ils partageaient. Il est important de noter que les isoformes OCT4 sont exprimées simultanément dans certaines cellules (par exemple, les cellules ES humaines), il est donc concevable que les isoformes OCT4 puissent interagir les unes avec les autres par interaction compétitive ou synergique aux niveaux transcriptionnel et/ou post-transcriptionnel. La possibilité et les mécanismes restent inexplorés.

Les résultats résumés dans cette revue suggèrent que OCT4 les isoformes, non seulement OCT4A mais également OCT4B et OCT4B1, contribuent aux profils d'expression et aux fonctions du gène OCT4 dans une variété de cellules humaines (Fig. 5). Comme d'autres gènes cruciaux (tels que FGF-2, VEGF, C-myc), OCT4 peut générer des variantes de transcription par épissage alternatif et diversité protéique par initiation de traduction alternative pour surmonter le nombre limité de gènes dans le génome et pour exécuter de multiples fonctions biologiques. Pour mieux comprendre l'OCT4, il est crucial d'identifier et de distinguer ses isoformes de OCT4 dans les modèles d'expression ainsi que les variétés fonctionnelles en biologie des cellules souches.

L'illustration schématique de la relation des isoformes OCT4 aux cellules variantes. Les isoformes d'OCT4 montrent la diversité dans différentes cellules. Abréviations : iPS, souches pluripotentes induites (cellules) ES, souches embryonnaires (cellules) PG, germes primordiaux (cellules) GCT, tumeurs des cellules germinales.


Détection d'isoformes de transcription à épissure alternative à partir de séquences à lecture longue à molécule unique sans génome de référence

L'épissage alternatif (AS) est une source majeure de diversité des transcrits et des protéomes, mais l'examen de l'AS chez les espèces sans génomes de référence bien annotés reste difficile. La recherche sur l'homme et la souris a démontré les avantages de l'utilisation des données Iso-Seq™ pour l'analyse du transcriptome au niveau des isoformes, y compris l'étude de la SA et de la fusion de gènes.

Des chercheurs de l'Université de Floride ont appliqué Iso-Seq™ pour étudier la SA chez Amborella trichopoda, une espèce pivot phylogénétiquement sœur de tous les autres angiospermes vivants. Leurs données montrent que, par rapport aux données RNA-Seq, la plate-forme Iso-Seq™ offre une meilleure récupération sur les transcrits volumineux, l'identification de nouveaux locus génétiques et la correction du modèle génétique. La détection de la SA basée sur les références avec les données Iso-Seq™ identifie la SA dans une fraction plus élevée de gènes multi-exoniques que celle observée pour l'analyse RNA-Seq publiée (45,8 % contre 37,5 %). Ces données démontrent que l'approche Iso-Seq™ est utile pour détecter les événements AS. En utilisant la collection de transcriptions définie par Iso-Seq dans Amborella comme référence, les chercheurs décrivent en outre un pipeline pour la détection des isoformes AS de PacBio Iso-Seq™ sans utiliser de séquence de référence (de novo). Les résultats utilisant ce pipeline montrent un taux de réussite global de 66 à 76 % dans l'identification des événements AS. Ce pipeline de détection de novo AS fournit une méthode pour caractériser et identifier avec précision les transcrits de bonne foi épissés alternativement dans tout système non modèle dépourvu d'une séquence de génome de référence. Par conséquent, ce pipeline a d'énormes applications potentielles et des avantages pour la communauté plus large de la biologie.


Résumé

Alors que la plupart des longs ARN non codants (lncRNAs) semblent indiscernables des ARNm, ayant des structures de coiffe 5' et des queues poly(A) 3', des travaux récents ont révélé de nouveaux formats. Plutôt que de profiter du clivage canonique et de la polyadénylation pour la maturation de leur extrémité 3', ces lncRNA sont traités et stabilisés par un certain nombre d'autres mécanismes, y compris le clivage de la RNase P pour générer une extrémité 3' mature, ou coiffés par des complexes snoRNP aux deux extrémités, ou en formant des structures circulaires. Il est important de noter que ces lncRNAs ont également été impliqués dans la régulation de l'expression génique dans les cellules de mammifères. Ici, nous mettons en évidence les progrès récents dans notre compréhension de la biogenèse et de la fonction des lncRNA sans queue poly(A).

Cet article fait partie d'un numéro dirigé intitulé : The Non-coding RNA Revolution.


La nouvelle isoforme d'épissage TREM2 dépourvue du domaine d'immunoglobuline V-set est abondante dans le cerveau humain

Olena Korvatska, Département de psychiatrie et des sciences du comportement, Université de Washington, Seattle, WA, 98195, États-Unis.

Département d'immunologie, Université de Washington, Seattle, Washington, États-Unis

Département de médecine, Division de génétique médicale, Université de Washington, Seattle, Washington, États-Unis

Département de médecine, Division de génétique médicale, Université de Washington, Seattle, Washington, États-Unis

Département de médecine, Division de génétique médicale, Université de Washington, Seattle, Washington, États-Unis

Département de médecine, Division de génétique médicale, Université de Washington, Seattle, Washington, États-Unis

Département de médecine, Division de génétique médicale, Université de Washington, Seattle, Washington, États-Unis

Département de psychiatrie et des sciences du comportement, Université de Washington, Seattle, Washington, États-Unis

Centre de recherche, d'éducation et de soins cliniques sur la maladie mentale (MIRECC), VA Puget Sound Medical Center, Seattle, Washington, États-Unis

Centre de recherche, d'éducation et de clinique en gériatrie (GRECC), VA Puget Sound Medical Center, Seattle, Washington, États-Unis

Département de psychiatrie et des sciences du comportement, Université de Washington, Seattle, Washington, États-Unis

Olena Korvatska, Département de psychiatrie et des sciences du comportement, Université de Washington, Seattle, WA, 98195, États-Unis.

Informations sur le financement : Subventions du National Institute of Health (P30AG013280 à O.K., 2R01 NS069719 à W.H.R.) Prix d'examen du mérite numéro 101 CX001702.

Résumé

Le récepteur de déclenchement exprimé sur les cellules myéloïdes 2 (TREM2) est un récepteur de type immunoglobuline exprimé par certaines cellules myéloïdes, telles que les macrophages, les cellules dendritiques, les ostéoclastes et la microglie. Dans le cerveau, TREM2 joue un rôle important dans la fonction immunitaire de la microglie, et son dysfonctionnement est lié à diverses affections neurodégénératives chez l'homme. L'ablation de TREM2 ou de sa protéine adaptatrice TYROBP provoque une ostéodysplasie lipomembraneuse polykystique avec leucoencéphalopathie sclérosante (également connue sous le nom de trouble de Nasu-Hakola) avec apparition précoce de démence, tandis que certaines variantes faux-sens de TREM2 sont associées à un risque accru de maladie d'Alzheimer à apparition tardive. L'humain TREM2 gène est sujet à un épissage alternatif, et son transcrit canonique majeur de pleine longueur englobe 5 exons. Nous rapportons ici un roman épissé alternativement TREM2 isoforme sans exon 2 (Δe2), qui constitue une fraction importante de TREM2 transcrits et a une expression interindividuelle très variable dans le cerveau humain (fréquence moyenne de 10 % comprise entre 3,7 et 35 %). La protéine codée par Δe2 est dépourvue d'un domaine d'immunoglobuline V-set de sa partie extracellulaire mais conserve ses domaines transmembranaire et cytoplasmique. Nous avons démontré l'expression de la protéine Δe2 dans des cellules THP-1 positives pour TREM2, dans lesquelles l'expression du transcrit complet était exclue par la perturbation CRISPR/Cas9 du cadre codant pour l'exon 2. Semblable au TREM2 pleine longueur, Δe2 est trié jusqu'à la membrane plasmique et est sujet à l'excrétion des récepteurs. Dans les expériences d'« ajout », Δe2 TREM2 avait une capacité réduite à restaurer la phagocytose du peptide bêta-amyloïde et à promouvoir la réponse IFN-I par rapport au TREM2 de pleine longueur. Nos résultats suggèrent que des changements dans l'équilibre de deux isoformes TREM2 mutuellement exclusives peuvent modifier le dosage du transcrit complet, affaiblissant potentiellement certaines fonctions des récepteurs TREM2 dans le cerveau humain.

Tableau S1. Caractéristiques cliniques et neuropathologiques des sujets d'étude.

Fig.S1 supplémentaire. Séquence nucléotidique et protéique des isoformes canoniques de pleine longueur et De2 TREM2.

Fig.S2 supplémentaire. Paramètres d'analyse par cytométrie en flux pour la phagocytose du peptide bêta-amyloïde (Ab) marqué au pHrodo par les cellules THP-1.

Fig.S3 supplémentaire. Expression des gènes de signature IFN I IFIH1 et IRF7 après stimulation des macrophages TREM2 KO THP-1 avec poly(I:C) + IFNb.

Remarque : L'éditeur n'est pas responsable du contenu ou de la fonctionnalité des informations fournies par les auteurs. Toute question (autre que le contenu manquant) doit être adressée à l'auteur correspondant à l'article.



Commentaires:

  1. Cocytus

    Félicitations, quels mots ..., une excellente idée

  2. Colton

    Cela ne vous concerne pas!

  3. Hewlett

    Excuse, j'ai pensé et repoussé l'idée

  4. Worden

    Phrase incomparable;)

  5. Peleus

    Dûment sujet

  6. Daegan

    En général, franchement, les commentaires ici sont beaucoup plus divertissants que les messages eux-mêmes. (Aucune infraction à l'auteur, bien sûr :))

  7. Lukas

    Je pense que vous faites erreur. Discutons. Écrivez-moi en MP, on en parlera.



Écrire un message