拒绝千篇一律!Iso-Seq当红研究思路盘点

来源: 安诺基因   2019-11-13   访问量:282评论(0)

在以往的全长转录组(Iso-Seq研究中,多数物种由于缺少参考基因组或基因组质量较差,研究方向上往往存在较大的局限性,普遍为发现新转录本、结合功能注释寻找关键基因等。但千篇一律难免会审美疲劳,综合最新研究进展不难发现,较为新颖的研究思路主要包括以下三点:

1. 分析无参物种的可变剪切事件,如利用Cogent软件等;

2. 多样品比较,分析共有、特异性转录本;

3. 对于参考基因组不完善的物种,改善其注释情况,使片段化基因趋于完整。

话不多说,我们直接看案例~


案例一:无参物种的可变剪切事件

 

文献名称Reconstruction of the full-length transcriptome atlas using PacBio Iso-Seq provides insight into the alternative splicing in Gossypium australe (PacBio全长转录组探究澳洲野生棉中的可变剪切)

样本选择:澳洲野生棉花的10个组织部位

测序策略:PacBio Sequel 平台,共5个SMRT Cell,获得100万条CCS reads


主要结果

 

文章中选取了不同成长阶段、不同处理的澳洲野生棉花共10个组织部位以丰富转录本的多样性。通过Iso-Seq测序,共鉴定了25,246个基因,86条pre-miRNA和1,468条lncRNA,超过50%的基因包含两条以上的isoform。利用Cogent软件进行可变剪切(AS)分析,共9,944个基因位点的31,448个AS事件得到识别,其中803个基因含有10条及以上的剪切异构体充分显示了该物种的转录组复杂性(下图a-c)。14,536个基因含有至少一个poly A 位点,其中1,075个基因含有至少5个poly A,体现了转录本的多样性。


1573641229452451.png

Iso-seq分析流程与AS分析

 

随后作者对种子发芽时期的AS事件进行了动态分析,这一阶段的AS事件数量明显增加,且多数出现在叶片;对10个已注释基因进行RT-PCR验证,结果与Iso-Seq测序结果相一致,每条转录本都表现出了时间、空间的特异性,表明Iso-Seq在探究特异性表达的转录本/AS事件方面具有显著优势。通过对不同发芽时期的差异表达基因进行富集和聚类分析,发现这些基因根据时间呈现变化的表达模式,功能依次涉及生物发生、细胞周期与分裂、物质合成与代谢等。本文为深入研究澳洲野生棉花的优良性质提供了有效信息。


案例二:多样品比较,分析共有、特异性转录本

 

 

文献名称Hybrid sequencing of the Gynostemma pentaphyllum transcriptome provides new insights into gypenoside biosynthesis(二三代转录组联合测序为绞股蓝皂苷合成提供新思路

研究背景绞股蓝是一种传统中草药,其主要有效成分为绞股蓝皂苷,具有抗肿瘤、降血糖血脂等多种功效。25%的绞股蓝皂苷与人参皂苷非常相似,且更易获得,因此绞股蓝皂苷的生产引起了世界范围内的极大兴趣。

样本选择:绞股蓝的根、茎、叶和经茉莉酸甲酯处理的叶片

 

 

主要结果


研究中利用Iso-Seq测序,共获得6.6万条纠错后的CCS序列,平均长度1,564 bp,高质量转录本平均长度2,075 bp,远远高于二代测序所获转录本的平均长度(下图a)。文中结合RNA-seq共获得约14万个unigene, 对它们进行功能注释,发现614个与萜类代谢、聚酮化合物相关和190个与萜类合成相关的 unigene(下图b-c)。

 

1573641376464664.png

Unigene序列长度分布与功能注释

 

随后,作者从中挑选了5个OSC(氧鲨烯环化酶)基因、145个CYP450基因和254个UGT(UDP糖基转移酶)基因,对它们进行了系统发生分析,以及在不同组织部位、经茉莉酸甲酯处理(刺激合成通路)后的表达模式进行分析(下图a-d)。参与相同合成通路的基因往往呈现表达相关性,最终研究人员锁定了GpOSC1GpCYP89和 GpUGT35作为绞股蓝皂苷合成的关键候选基因,6个GpWRKY 和1个 GpbHLH基因作为调节合成通路的关键基因。本文将二三代转录组测序手段相结合,为探究次生代谢产物的合成途径提供了新思路,同时也促进了对绞股蓝代谢调节、生物合成和分子育种的研究。

 

1573641399110279.png

候选基因表达模式分析


案例三:多样品比较,分析共有、特异性转录本


文献名称Characterization and analysis of the transcriptome in Gymnocypris selincuoensis on the Qinghai-Tibetan Plateau using single molecule long-read sequencing and RNA-seq(二三代转录组联合测序解析青藏高原裸鲤转录组特征)

样本选择:色林错裸鲤的脑、心、肝、肾、鳃、肌肉和卵巢,共7个组织部位

测序策略:PacBio RS II平台,获得33.7万条CCS reads。


主要结果


色林错裸鲤是色林错湖中唯一的鲤科鱼类,遗传信息一直处于空白的状态,因此限制了对其在分子遗传方面的研究。本次研究中作者选取了色林错裸鲤7个不同的组织部位,对其进行Iso-Seq测序,共获得75,435条平均长度为3,509 bp的全长转录本,远高于RNA-seq的平均长度815 bp;通过预测得到的2,811条lncRNA,平均长度为2,586 bp(下图A)。对7个不同组织进行转录本表达分析,发现10,488条为它们的共有转录本,卵巢和脑组织拥有数量最多的特异性转录本,分别为1,628和1,494条(下图B-C)。与其他鲤科鱼类进行基因组分析比较,共鉴定到77个同源基因(Ka/Ks > 0.3)。此外,作者还从全长转录本中鉴定到了56,696个SSR。本项研究为研究色林错裸鲤和其他同类鱼的适应性进化、基因表达和群体遗传学提供了重要的遗传信息资源。

 

1573641513171279.png

转录本长度、lncRNA与组织特异性转录本分析

 

案例四:改善其注释情况,使片段化基因趋于完整

 

文献名称Improved annotation of the domestic pig genome through integration of Iso-Seq and RNA-seq data(二三代转录组测序数据联合改善家猪基因组注释情况)

 

样本选择:家猪的肝、脾、胸腺、脑、下丘脑、膈肌、小肠、垂体和最长肌共9个组织部位

测序策略:PacBio RS II平台,共获得440万条reads


主要结果


研究中通过Iso-Seq测序,共获得了6.7万条高质量转录本,其中60.5%为蛋白编码序列,36.2%为lncRNA。对不同组织部位进行转录本比较,除肌肉组织外,脑部的转录本数量最少,脾脏中最多。通过与现有的猪基因组进行比对,仅1.3万条为已知转录本,超过80%(5.4万条)为新转录本,新基因超过1万个。大多数新转录本的平均表达水平较低,约50%仅出现在单一组织中,因此利用Iso-Seq对多个组织部位进行测序,并提高测序深度,可以有效提升基因组的注释水平。组织特异性(TS)转录本占全部比例的44%(3万条)。

 

1573641676612414.png

转录本与基因结构分析


比较Iso-Seq所获与已知转录本的结构,可分为9个不同类型,60%的新转录本为j型,至少含有参考转录本中的一个剪接点(上图a-c)。平均每个已知基因的转录本数量提升至4条,超过6,000个已知基因的边界得到扩展,且3’端扩展的平均长度更长(见下图),表明利用Iso-Seq可以使基因片段更加完整。本项研究显著改善了猪的现有基因组注释情况。


image.png

已知基因5’与3’端边界扩展

 

受二代测序的技术限制,大多数物种都存在未知的基因与转录本等待被发现,因此在完善基因组注释、分析基因结构、发现转录本时空特异性等方面仍有很大的探索空间目前,针对无参物种的可变剪切分析、多样品共有特有转录本分析,均已加入高级分析豪华套餐中~新的思路,助力突破新高度~


自2017年推出三代测序服务以来,安诺优达先后引进了10台PacBio Sequel和4台Sequel II测序仪,产品服务类型涵盖三代基因组组装、人重测序、动植物重测序、全长转录组测序等,累计完成三代项目超800+。2019年7月,安诺优达测序实验室又荣获PacBio官方认证测序服务商证书。安诺优达将秉承客户至上的服务理念为合作伙伴提供更快速、更优质的三代测序服务。


参考文献:

1. Feng Shouli, Xu Min, Liu Fujie et al. Reconstruction of the full-length transcriptome atlas using PacBio Iso-Seq provides insight into the alternative splicing in Gossypium australe[J]. BMC Plant Biol., 2019, 19: 365.

2. Liang Tongtong, Zou Liqiu, Sun Sijie et al. Hybrid sequencing of the Gynostemma pentaphyllum transcriptome provides new insights into gypenoside biosynthesis[J]. BMC Genomics, 2019, 20: 632.

3. Feng Xiu, Jia Yintao, Zhu Ren et al. Characterization and analysis of the transcriptome in Gymnocypris selincuoensis on the Qinghai-Tibetan Plateau using single-molecule long-read sequencing and RNA-seq[J]. DNA Res., 2019, 26: 353-363.

4. Beiki H, Liu H, Huang J et al. Improved annotation of the domestic pig genome through integration of Iso-Seq and RNA-seq data[J]. BMC Genomics, 2019, 20: 344.



安诺基因   商家主页

地址:北京市亦庄经济技术开发区,科创六街生物医药园B1-B2栋,安诺优达
联系人:裴博士
电话:4008-986-980
传真:010-56315338
Email:service@genome.cn