您的位置:首页 >知识精选 >正文

大规模长末端重复插入在棉花中产生了一组重要的新转录本

摘要 本研究由武汉大学高等研究院朱玉贤课题组报道。已知 TE(转座因子),尤其是 LTR,在决定基因组基本结构和影响功能基因表达方面发挥着重要

本研究由武汉大学高等研究院朱玉贤课题组报道。已知 TE(转座因子),尤其是 LTR,在决定基因组基本结构和影响功能基因表达方面发挥着重要作用。插入 TE 或 LTR 片段还可以创建新的转录起始位点 (TSS) 以启动宿主基因组中的转录。新的基因间转录物被认为是通过使用从头的组合通过末端重复逆转录转座子插入产生的和玉米中基于同源性的策略。尽管这些研究预测了通过转座子插入产生新转录本的可能性,但它们并未揭示这些新转录本的进化、调控和功能机制。此外,迄今为止,甚至还没有一项关于基因组水平的基因间转录本产生广泛性的系统研究。在这里,Yuxian Zhu 和他们的同事在每个棉花样本中应用了极深的测序技术(从 10 G 到超过 100 G),发现了 10,000 多个在以前的基因组组装和注释中基本上没有发现的新基因。大多数这些转录本本质上是蛋白质编码的,并且是由 LTR 插入以各种方式产生的。

研究小组发现,更多的转录本主要出现在先前发表的基因组中确定的基因间区域。在100G的数据集中,一共发现了10284个新的基因间基因。总共有 10,032 个是蛋白质编码基因,252 个是 lncRNA 基因。这两组之间的基因数量没有显着增加。一般来说,这些新的基因间转录物表达水平很低,而且大部分是单外显子转录物。

由于表达水平低,这些新的基因间转录本仅在测序深度达到30 G至100 G时才出现。使用针对 H3K4me3、H3K27ac 和 H3K9me2 的抗体进行 ChIP-seq 分析表明,这些新转录物中的大部分可能不会被 RNA 聚合酶 Ⅱ 转录。这些基因间转录物中只有 30% 具有一个或两个转录激活标记,而超过 70% 的基因包含这些标记。MNase-seq 分析表明,没有转录激活标记的基因形成其 +1 和 -1 核小体的距离明显更近(相距仅 117±1.4 bp),而具有转录激活标记的基因的空间是其两倍(相距约 403.5±46.0 bp)激活标记。没有这两个标记之一的基因旨在在其 +1 核小体附近形成 -1 核小体。

进化分析表明,基因基因起源于 130.8 或 16 MYA 左右的全基因组复制事件之一,而 ITG 转录本是在 2.3 MYA 左右进化的,这是最后一次逆转录转座子插入的结果。

这些低转录 ITG 转录本的特征将帮助我们了解逆转录转座子在物种形成和多样化过程中的生物学作用。本研究可能有助于阐明与基因间转录本表达和棉花纤维发育相关的机制。

版权声明:本文由用户上传,如有侵权请联系删除!