转录组测序 | 功能基因组研究必备

转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,主要包括 mRNA和非编码RNA 。转录组研究是基因功能及结构研究的 基础和出发点,通过新一代高通量测序,能够全面快速地获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息,已广泛应用于基础研究、临床诊断和药物研发等领域。

RNA-Seq对比芯片技术的优势

  • 无偏好的新型转录本检测:与芯片不同,RNA-Seq技术不需要物种或转录本特异性探针。该技术可检测新型转录本、基因融合、单核苷酸变异、插入缺失(小片段插入和缺失)以及之前采用芯片无法检测的其他未知变化。
  • 动态范围更宽:使用芯片杂交技术时,基因表达测定受到背景噪音(下限)和信号饱和(上限)的限制。RNA-Seq技术通过离散的定量以及数字化的read读数提供了更宽的动态范围。
  • 特异性和灵敏度更高:与芯片相比,RNA-Seq技术的特异性和灵敏度更高,从而全面提升对基因、转录本以及其他差异表达的检测。
  • 轻松检测稀有和低丰度转录本:轻松提高测序覆盖深度以检测稀有转录本、每个细胞的单一转录本或弱表达基因。

科学方案设计

  • 真核生物转录组
  • 原核生物转录组
  • 单细胞转录组
  • 融合基因
  • 可变剪接
  • 转录组拼接

传统转录组测序方案设计

真核转录组测序

RNA测序(RNA-Seq)正在彻底改变转录组的研究。它是一种高度灵敏和准确的检测全转录组表达的工具,它让研究人员能够检测疾病状态、治疗反应、各种环境条件下以及一系列其他研究设计中以前无法检测的变化。

RNA-Seq可使研究人员在单次分析中检测已知的和新的特征,使检测转录本亚型、基因融合、单核苷酸位点变异和其他特征不受先验知识的限制。

原核转录组测序

转录组是指由生物的基因组所编码的一整套RNA。宏转录组学包含复杂样品内的一组生物所编码的所有RNA。对于微生物而言,了解基因表达动态对定量转录本水平很关键,因为生物对环境或宿主条件的变化作出反应。微生物转录组和宏转录组信息对于预测特定抗生素的耐药性,了解宿主与病原体的免疫相互作用,以及追踪疾病发展十分重要.

与芯片等杂交方法不同,RNA-Seq实现了无偏向、链特异的常见和新颖转录本鉴定。宽的动态范围让单个RNA-Seq实验就能自信鉴定高和低的表达子。通过适合自动化的简化流程,多个样品可一次处理。

转录组测序研究方向

表达量计算与差异表达分析

对受测样本转录组表达量进行计算。基因表达量的计算将考虑基因表达量标准化(normalization)这一因素,采用RPKM计算方法。RPKM具体定义为:readsperkilobasepermillionmappedread。我们采用的RPKM考虑到可变剪接(AS)形式的多样性,并根据该AS的注释综合计算基因的表达量。根据考虑SJ的RPKM方法,我们保证具有较多内含子(intron)的基因的RPKM不会被低估。最后,我们将对基因model上的所有read数目求和,并将对其进行标准化处理(通过millionreads数目)。标准化的目的是为了矫正来自转录本3'端的较强偏差。

可变剪接分析

采用splice grap算法探测RNA-Seq转录组数据中差异的可变剪接事件(Differential Alternative Splicing Events)。该方法的优点在于(1)提供严格的统计学分析流程(框架framework)分析可变剪接体。(2)从复杂的包含信号(序列)噪音的RNA-Seq数据中稳健地识别异构体/可变剪接体在样本之间的差异比值。本项目分析可以准确探测到转录组中存在的差异性转录事件。本分析不依赖于已知的转录本注释坐标信息,可以发现新可变剪切体和转录调控事件;同时计算差异转录本的表达差异性。通过识别检验转录本可变剪接体在样本内与样本之间表达变异,采用可变剪切体模式搜索技术准确识别可变剪接体(AS,Alternative Splicing)发生的位置;并采用非参数检验方法计算分析表达量的差异,目前比其他报道的可变剪切分析算法更准确灵敏。

融合基因

根据pair-end测序模式获得的读长Read,我们依据融合基因的形成条件搜寻基因组重排情况:paired-ends测序读长(reads)分别比对到不同的基因外显子编码区paired-ends测序读长(reads)比对的方向相同没有阅读框错位发生。

de novo 转录组拼接

在没有参考基因组情况下完全依据单端或双端RNA测序数据重构转录本和基因。目前,对于无参考基因组的转录组数据可以应用该方案完成转录本的鉴定重构,并结合转录本的功能注释完成新物种转录组研究。该方案可以配合表达量计算,可变剪接分析,以及差异表达分析等分析模块共同探索新物种的转录组。

ASE 特异等位基因表达分析

对转录本中的特异等位基因表达量进行偏差检验,分析是否存在显著的等位基因表达偏好性,即ASE。ASE可以通过杂合基因型的相应Read比对数目来衡量。对于纯合基因型无法评估ASE。

基因表达数量性状定位(eQTL)分析

将数量性状定位(quantitativetraitloci,QTL)和基因表达谱分析联合运用,产生了遗传基因组学或基因表达数量性状定位(expressionQTL,eQTL)。eQTL的主要目标是鉴别表达性状座位所在的染色体区域。高通量的基因型分析和RNA-Seq转录组测序技术的发展使人们能够进一步研究哪些遗传差异最终影响基因的表达。通过表达数量性状座位(eQTL)作图方法可对基因表达水平的遗传基础进行解析。

我们的优势

拥有标准化操作实验室和高通量测序技术平台,实验周期短,质量可靠。
拥有Illumina HiSeq 2500、MiSeq等多种高通量测序平台。
技术人员经验丰富,可以根据合作伙伴要求提供实验方案、解决实验问题、分析实验结果。
拥有专业的生物信息团队和超算服务器,可为合作伙伴提供全面生物信息分析服务与技术支持。
  • illumina 二代测序平台
  • PacBio单分子三代测序仪
  • nanopore纳米孔测序仪
  • Bionano单分子测序平台-Lrys系统

高性能节点服务器 | 分析无忧

基于Dell,超威等国际知名服务器供应商的支持,运用高性能刀片节点高密度计算性能,总计提供20000+核心算力,保证24x7连续生产力安全稳定。

Nvme SSD硬盘 | 让分析速度飞起来

基于Nvme SSD固态硬盘加速器,可以淋漓尽致发挥出网络计算的魅力,让你的任务计算飞起来!

高通量 | 高速率 | 无阻塞网络集群

高通量测序数据日益加大,呈指数型积累上升,必须交由高速网络提速分析。

基于以色列Infiniband技术,惠研云构建优化了集群计算性能,使得计算IO提升300%,持续数据交互速率提高到2T总带宽,保证集群中任务与数据0延迟,无阻塞。