基因组测序 | 踏上生物研究的征途

全基因组重测序已经成为动植物育种、群体进化、药物研发、疾病研究和临床诊断中最为迅速而有效的方法之一; 在全基因组水平上扫描并检测与生物体重要性状相关的突变位点对分子育种研究具有重大的科研价值和产业价值。

科学方案设计

肿瘤基因组方案设计

肿瘤体细胞突变与肿瘤发生
转移复发因素的关系

如果研究肿瘤是从体细胞突变角度入手,对于肿瘤患者,可以进行全基因组测序或SNP基因芯片技术的检测发现体内肿瘤DNA与生殖系DNA之间的差异(即Somatic mutation)。体细胞突变(somatic mutation)是只存在与肿瘤细胞的变异,往往与肿瘤发生,转移与复发事件密切相关,与肿瘤进化,肿瘤抗药性与预后效果(好坏)有直接的分子学上的关联。 通过这种大量同类肿瘤样本的肿瘤-癌旁对比分析可以寻找到高频率发生的体细胞突变基因和位点图谱,突变图谱的构建和认识发现对于筛选抗癌药物的作用靶点,个性化抗癌治疗提供了非常重要的信息线索。

肿瘤起源

肿瘤起源与肿瘤发展进化历程的讨论研究也是肿瘤基因组的研究热点之一。肿瘤发生起源学说主要有一些提出的学说,利用肿瘤基因组大数据可以分析讨论。干细胞分化会产生一些细胞的前提细胞和成熟细胞群。基于学术界对肿瘤起源的研究进展,对肿瘤发生学说产生以下一些观点学说:克隆性学说,肿瘤在不同细胞分化过程具有均等突变概率发生发展成为肿瘤细胞; 肿瘤干细胞学说,在干性细胞群内产生肿瘤干细胞; 基于上述两点综合起源路径(首先在干性细胞中产生肿瘤干细胞,然后再分化过程中随后产生突变系肿瘤细胞)。

结构变异分析

结构变异(StructureVariation,SV)是基因组变异的一类主要来源,主要由大片段序列(一般>1kb)的拷贝数变异(copynumbervariation,CNV)以及非平衡倒位(unbalanceinversion)事件构成。本分析模块将识别SNV结构及其断点(breakpoint),统计SNV类型在基因组内的分布状态,并与样本表性数据相关联。

SV形成机制包含:(1)同源性介导的直系同源序列区段重组(NAHR)(2)与DNA双链断裂修复或复制叉停顿修复相关的非同源重组(NHR)(3)通过扩展和压缩机制形成可变数量的串联重复序列(VNTR)(4)转座元件插入(一般主要是长/短间隔序列元件LINE/SINE或者伴随TEI相关事件的两者的组合)。

基因编辑测序方案设计

CRISPR基因组编辑技术

CRISPR(规律成簇间隔短回文重复序列)基因组编辑是一种革命性的方法,其中的可编程RNA能将核酸酶(例如Cas9)靶向基因组中的特定位置。1,2CRISPR-Cas9技术具有突变、沉默、诱导或替换遗传元件的功能,凭借其快速、简易以及精确的优势广泛应用于世界研究领域。整合CRISPR基因组编辑与新一代测序(NGS)的信息力,使研究人员能够完全控制整个编辑实验,从而更好地了解他们正在修饰的生物系统。

CRISPR基因组编辑的应用

CRISPR-Cas9技术的应用已经在基础和临床研究、治疗、药物开发、农业和环境等领域得到了确认。临床研究显示,CRISPR在癌症、艾滋病、亨廷顿舞蹈症、杜氏肌肉营养不良症等疾病中具有潜在的应用价值。

CRISPR基因组编辑使研究人员能够快速、精准地创建转基因细胞系和动物模型。除了进行基因敲除和更具体的修饰外,研究人员还可使用CRISPR技术通过干扰(CRISPRi)或激活(CRISPRa)的方法调节基因表达,而不改变基因组序列。

确认CRISPR敲除和其他编辑

CRISPR基因组编辑实验得到的是混合细胞群,其中仅有一小部分细胞携带所需的编辑。研究人员需要确定哪些细胞具有所需的CRISPR敲除或靶向突变。目前评估编辑的方法包括切割分析、PCR、桑格测序和新一代测序(表)。

新一代测序是唯一一种在整个修饰范围内以高分辨率提供定性和定量信息的检测方法,能够满足任何通量的需求,并且可用于监测脱靶效应。7基于新一代测序的靶向测序通过关注靶向修饰区域,为确认CRISPR诱导的编辑提供了一种经济有效的解决方案。

在基因组编辑中使用新一代测序的更多方法

除了高分辨率的匹配和脱靶评估、功能验证以及对CRISPR敲除和编辑的评估外,新一代测序还可以在CRISPR基因组编辑工作流程的其他阶段整合。

在最初的设计阶段,一个基因位点或基因组的重测序(对于缺乏参考基因组的物种)有助于RNA选择。在克隆CRISPR-Cas9/向导RNA构建的过程中,对得到的质粒进行重测序,可以快速、高度可信地验证CRISPR的递送载体,特别是对于有大型质粒文库的高通量实验。

单基因遗传疾病研究方案设计

对于单基因致病位点,可以对有近亲关系和非近亲血缘关系的个体通过捕获并测序外显子区域上的各种类型的突变情况,包括SNP和 InDel,进行筛选。根据外显子组测序结果并结合假设的遗传模型准确地推断疾病位点,我们可以对于纯合型或杂合型的SNP以及indel进行系统详细的 功能性分析,包括蛋白突变体危害性评估,突变体蛋白结构解析,最终阐释单基因病因与分子变异的功能的关系。同时,利用自有开发算法可以对近亲婚配子女或非 近亲婚配子女患病的共享的潜在的疾病易感位点、片段完成推断问题;或是来自Trios 设计的样本寻找患者特有的de novo 突变。

对于染色体疾病,一般可以采用CNV芯片或(低覆盖度)全基因组测序分析解析染色体疾病致病区域。

三人核心家系新突变分析

家族性复杂疾病研究通常采用家系内三人家庭单元结构(trios)的基因型分析识别de novo突变体(DNMs)和突变频率。de novo突变在常见和罕见疾病,以及遗传疾病中的作用有很多功能是未知的,但识别发现de novo 突变有助于复杂疾病的新机制的发现,de novo的有害突变率和de novo突变的选择性对于理解疾病的遗传基础是非常重要的。研究者已经针对Autism与Schizophrenia的trios 家系,多数采用全基因组测序、外显子组测序或基因靶向重测序技术实现并发现患者携带的DNMs具有明显的有害突变。本方案是采用似然值方法评估de novo突变在家庭组中的发生概率和全新de novo 有害致病性突变。

复杂疾病研究方案设计

宏基因组多样性分析

宏基因组测序与微生物(病毒)基因组的鉴定针对个体样本独立完成denovo的拼接工作。并在每一轮拼接后继续进行被过滤数据的重新校验拼接。利用基于插值马尔科夫模型的方法GLIMMER,以及MetaGene等算法预测微生物的ORF;个性化定制用户可以与已公开发表的实验数据集做比较分析。基于种群结构的鉴定和定量分析,采用PCA主成分分析技术对样本的种群结构差异性及其微生物进行深度解析。

构建微生物共相关网络

根据微生物基因组的beta多样性,将微生物之间的关系以网络形式进行展示,通过种群之间共享ORF的数目及其功能相对丰度进行PCC(相关性)计算,权重作为网络边的权重,网络节点为微生物群落内的成员,最后建立微生物共相关网络。本方案也将对微生物网络的拓扑学结构进行深度解析:包括度与边,节点分布规律和权重大的发挥重要的微生物种群的定位。

宏基因组研究方案设计

GWAS全基因组关联分析
Genome-Wide Association Anlaysis

GWAS全基因组关联分析的主要目的是识别疾病关联的SNP位点和CNV区域,通过具有LD-关联连锁关系的SNP标记来捕获潜在的易感基 因位点。在大部分GWAS研究中,我们通过tagSNP(标签SNP)来推断预测和疾病关联的位点位于何处。后续GWAS分析将针对SNP疾病易感位点进 行评估和功能验证。

根据研究设计不同和研究表型的不同,采用的统计分析方法亦不同。如病例对照研究设计(质量性状),比较每个SNP的等位基因频率在病例和对 照组中的差别可采用4格表的卡方检验,计算相对危险度(Odds Ratio,OR值)及其95%的可信限。此外,还需要调整主要的混杂因素,如年龄、性 别等。这里采用logistic回归分析,以研究对象患病状态为因变量,以基因型和混杂因素作为自变量进行分析。我们也将针对对全基因组SNP位点进行关 联分析采用 additive模型Cochran-Armitage trend test ; 全基因关联结果的Q-Q plot , 可以评估是否存 在系统性的偏差。关联分析的结果可视化展示,根据LD连锁关系将多SNP与表型性状进行关联展示(如下图所示)。

表达数量性状(eQTL)分析

将数量性状定位(quantitativetraitloci,QTL)和基因表达谱分析联合运用产生了遗传基因组学或基因表达数 量性状定位(expressionQTL,eQTL)。eQTL的主要目标是鉴别表达性状座位所在的染色体区域。高通量的基因型分析和RNA-Seq 转录组测序技术的发展使人们能够进一步研究哪些遗传差异最终影响基因的表达。通过表达数量性状座位(eQTL)作图方法可对基因表达水平的遗传基础进行解 析。通过基因表达的数量定位分析(eQTL)分析可寻找控制基因表达的上游调控位点,挖掘受该基因调节的下游基因及与该基因协同作用的基因,并建立基因调 控网络,从而在表达及调控两个水平上研究控制复杂性状的遗传基础。

我们的优势

拥有标准化操作实验室和高通量测序技术平台,实验周期短,质量可靠。
拥有Illumina HiSeq 2500、MiSeq等多种高通量测序平台。
技术人员经验丰富,可以根据合作伙伴要求提供实验方案、解决实验问题、分析实验结果。
拥有专业的生物信息团队和超算服务器,可为合作伙伴提供全面生物信息分析服务与技术支持。
  • illumina 二代测序平台
  • PacBio单分子三代测序仪
  • nanopore纳米孔测序仪
  • Bionano单分子测序平台-Lrys系统

高性能节点服务器 | 分析无忧

基于Dell,超威等国际知名服务器供应商的支持,运用高性能刀片节点高密度计算性能,总计提供20000+核心算力,保证24x7连续生产力安全稳定。

Nvme SSD硬盘 | 让分析速度飞起来

基于Nvme SSD固态硬盘加速器,可以淋漓尽致发挥出网络计算的魅力,让你的任务计算飞起来!

高通量 | 高速率 | 无阻塞网络集群

高通量测序数据日益加大,呈指数型积累上升,必须交由高速网络提速分析。

基于以色列Infiniband技术,惠研云构建优化了集群计算性能,使得计算IO提升300%,持续数据交互速率提高到2T总带宽,保证集群中任务与数据0延迟,无阻塞。