基因组学|德航五洲技术服务
基因组学技术基本类型描述|德航五洲暨品科研技术服务
简介1:全基因组de novo测序又叫从头测序
全基因组de novo测序又叫从头测序,是指而对某个物种进行测序,然后在不依赖于任何已知的基因组序列信息的情况下利用生物信息学分析手段对序列进行拼接、组装,最终得到该物种的基因组序列和相关注释信息。随着基因组研究的迅速发展,全基因组测序已逐步成为生物学基础研究的重要手段之一。全基因组 de novo测序不仅可以获得该物种的全基因组序列图谱,同时也为后续物种起源进化及特定环境适应性的研究奠定了基础。根据基因组的复杂程度,基因组可分为简单基因组和复杂基因组。简单基因组主要指重复序列比例低于50%的单倍体或者高纯合的二倍体;复杂基因组主要指重复序列高于50%,杂合度大于0.5%的二倍体或多倍体基因组。
|
|
简单基因组 |
复杂基因组 |
|
重复序列比例 |
<50% |
>50% |
|
杂合度 |
<0.5% |
>0.5% |
基本测序和分析技术流程:
简单基因组de novo测序的技术流程如下图所示:
复杂基因组 de novo 测序的技术流程一般如下图所示:
基因组分析的内容详解
基因组序列是进行物种分子生物学研究的基础,通过全基因组de novo测序,可得到物种全基因组序列及基因注释信息,达到破译物种遗传信息的目的,对于后续研究物种起源、进化及特定环境适应性及比较基因组学研究都有很重要的意义。
基因组分析内容大致可分为如下几块内容:
1. 物种相关信息的搜集:测序之前,需要首先搜集物种的相关信息,如基因组大小、杂合度等。一般物种的基因组大小可以从http:://www.genomesize.com/ 的数据库中查到,如没有收录,则需要通过实验方法估计基因组大小。目前常用的方法包括流式细胞仪法、荧光光度计法、定量PCR、核型电泳、溶解曲线法及Kmer分析估计法。基因杂合的情况广泛存在于具有重要经济或科研价值的物种中,如大部分林木、水产类和昆虫等。这类基因组拼接比较困难,导致基因组图谱绘制方案成本高、周期长。
2. 基因组拼装统计。提供基因组拼装的基本信息,包含原始数据统计、测序覆盖率统计、Contig N50大小、Scaffold N50大小、基因组GC含量等信息。
3. 基因组注释。包括基因预测、基因功能注释(同NR、Swiss-Prot、Interproscan等数据库进行同源比对)、重复序列分析及non-coding RNA注释等。
4. 基因功能分析。GO分类、KEGG通路分析等。
5. 比较基因组学及进化分析。通过比较相近物种的基因组数据,丛基因功能、基因组结构、分子进化等方面对目标基因组进行分析。
|
de novo 测序 |
分析内容 |
备注 |
|
|
基因组组装/拼接 |
基因组survey(大小评估) 组装策略 组装结果评估 |
Kmer分析估计法估算基因组大小及其杂合度; 采用Falcon、Canu、wtdbg2 等基因组组装软件及 Racon、Quiver 、Pilon 等纠错软件,从纯三代、10X Genomics到结合新技术混合、拼接,针对不同的基因组特征,采取不同的策略,致力于得到最优的组装结果。 通过自有的程序来统计基因组组装的序列长度、N50、GC含量等信息 |
|
|
基因组注释 |
重复序列注释 |
采用Misa、RepeatMasker等软件进行重复序列分析 采用多种软件进行基因预测,并整合得到最优的基因预测结果 采用BLAST软件进行基因功能注释,涵盖各大主流基因功能数据库 采用tRNAscan-SE及RNAmmer进行非编码RNA的预测及注释 |
|
|
基因组评估 |
基因组完整性评估 |
采用BUSCO检测基因组完整性 |
|
|
基因组生物信息学分析 |
比较基因组分析 |
基因家族分析 |
下载收集不同物种的基因组序列、基因序列、蛋白质序列进行互相比较分析 根据不同的研究目的,应用不同的软件进行 |
|
个性化分析 |
针对物种自身特点制定高级分析方案 |
单独收费 |
|
简介2:全基因组重测序分析
全基因组重测序是对已知参考基因组的物种进行再次测序,是基因组测序工程在实践领域的常规应用之一。通过对该物种的不同个体或同一个体的不同组织进行基因组重测序,可从群体或个体水平全面挖掘基因组序列群体差异。该方法能获得大量、准确的基因组信息,对动植物育种及人类疾病研究等方面具有重大的指导意义。目前全基因组重测序已广泛应用于个体基因组变异检测、突变体功能突变位点定位、群体遗传学分析和全基因关联分析等各项研究。
利用Illumina测序平台对人类不同个体或群体进行全基因组测序,并在个体或群体水平上进行生物信息学分析,可全面挖掘基因组的SNP/InDel/CNV/SV等各类变异,为筛选疾病的致病及易感基因,研究发病及遗传机制提供重要信息。
技术流程
基本技术流程的主要构成:
|
|
生物信息学基本分析
1、标准分析:原始数据基本分析、序列比对和SNP分析等;
2、高级分析:InDel分析、CNV分析和SV分析等;
3、个性化分析:群体遗传学分析和GWAS分析等。
服务流程:
样品寄送、建库测序、数据分析、出具报告和售后答疑。
样品要求(更清楚)
样品浓度≥30ng/uL;总量≥6 μg ;OD260/280 = 1.8~2.0。
简介3:宏基因组测序分析
宏基因组是指特定环境中全部生物(微生物)遗传物质的总和。宏基因组测序,即利用新一代高通量测序技术(NGS)对环境样品中全部的微生物的基因组进行测定,以分析微生物群体的基因组成及功能;解读微生物群体的多样性和丰度;探索微生物与环境及宿主直接的关系,发掘和研究新的具有特定功能的基因等。与传统微生物研究方法相比,宏基因组测序技术规避了绝大部分微生物不能培养、痕量菌无法检测的缺点,因此,近年来在环境微生物学及医学研究中得到了广泛应用。
技术流程
样本的原始数据经过数据拆分、质量检测及去除污染等优化处理后,通过序列组装、基因预测,获得每个样本中所含有的所有基因,将所有样本的基因整合在一起,构建非冗余基因集。优化序列mapping至基因集,可以获得每个基因的丰度信息。将基因与相关数据库,如NR、KEGG、eggNOG、ARDB、CAZy等进行比对,获得基因的物种注释信息与功能注释信息。在此基础上,可以进行多样品间的物种组成比较分析、单样品主成分菌群分析、多样品间物种丰度分析、样品间基因功能丰度差异分析、丰度差异基因的GO富集分析、丰度差异基因的KEGG富集分析、基因集聚类分析等。并对结果进行可视化展示,挖掘数据中的有效信息,揭露隐含的规律,验证实验假设并发现新的问题。
生物信息学分析
|
分析内容 |
解决问题 |
|
测序数据质量评估 |
过滤掉低质量数据,保证数据质量 |
|
基因预测 |
基因预测及相关性分析 |
|
物种、功能注释 |
物种、基因功能注释及相关分析 |
|
CARD |
耐药基因相关分析 |
|
CAG/MLG分析 |
疾病和菌株关联研究 |
|
CNV(copy number variation) |
菌株拷贝数变异与疾病关联研究 |
|
噬菌体 |
噬菌体及前噬菌体预测及分析 |
服务流程
样品寄送 建库测序 数据分析 出具报告 售后答疑
样品要求
土壤:10 g;粪便:3-5 g;血液:10 mL;污泥/沉积物:5-10 g;
DNA:总量 ≥ 1 μg、浓度 ≥ 20 ng/μL、1.8 < OD260/280 < 2.0。
简介4:常规转录组测序
转录组介绍
转录组(Transcriptomics)是利用高通量测序,对生物细胞、组织、器官或者个体中所有转录和表达的基因进行分析定量的技术。转录组具有通量高、快速、稳定可靠等优点,能对基因的整体表达情况进行定量和定性,同时能够获得详细的基因结构信息,为生物学研究和检测提供了强有力的手段,目前广泛应用于生物基础研究、医学诊断、药物开发和分子辅助育种等领域。
技术流程
根据用户需求,可制定不同的检测方案。转录组数据分析主要包括有参转录组分析、无参转录组分析、全长转录组分析等。
技术保障:
1. 最新的测序仪器:基因芯片、PCR芯片及实时定量PCR,Nanopore,Pacbio等
2. 一对一用户样品采集指导:提供用户采样部位、采样方法、送样方法专业指导。
3. 样品采集-样品前处理-样品测试-数据分析全流程经验积累和配套管理。
4. 与多家科研院所和高校建立密切合作关系,保障技术在本领域的先进性。
结果展示:
生物学重复样本间的相关性评估
生物学重复之间的一致性是整个实验结果可靠性的保证,是检验实验操作可重复性的一个重要指标。利用这项分析可以筛选出异常样品,对后期差异基因分析的结果进行初步评估。
基因差异表达分析
样品间差异表达的基因是造成生物学差异的根本原因,是研究人员关注的重点。筛选差异基因的通常标准是:Fold Change≥2,FDR<0.01。如果样本有生物学重复,可以使用DEseq对样品组间差异表达的基因进行分析;如果没有生物学重复,可以采用EBseq差异分析差异基因。
基因聚类分析
根据基因的表达模式,对相同表达特征的基因聚集在一起,从而对基因的整体表达特征进行分析。相同表达特征的基因可能功能类似,或者参与相同的生物学过程,因此可以对未知基因功能进行判断和筛选。
基因GO分类
GO注释系统把基因分为生物过程(biological process)、细胞组分(cellular component)和分子功能(molecular function)三大类,每个下面又分为很多小类,根据GO注释分类统计结果,可以了解每个分类的数量分布。可以分析差异基因在每个功能和通路上的富集情况,了解基因表达变化背后隐藏的生物学意义。
基因互作网络分析
根据已知的蛋白质-蛋白质互作数据库,获得差异表达基因之间的对应关系,构建目的基因的互作网络。
合作客户:
到目前为止,转录组学已经开展了全国范围内的客户服务。技术服务涉及的科研院所多达几十家,遍布全国十几个省市自治区,如清华大学、山东大学、协和医科大学、海南大学、内蒙古大学、中国医学科学院药用植物研究所、中科院微生物研究所、中科院生物物理研究所、中科院植物研究所等。
样本要求:
对生物样品基本要求:样品新鲜采集、快速超低温冷冻、干冰寄送。详细步骤根据样品特点和检测目的在采集和送样前咨询相关工作人员。
简介5:全长转录组测序
全长转录组测序是在长读长的高通量测序技术发展成熟之后兴起的一项测序服务,它是转录组测序服务的一种。它主要采用三代测序平台(Pacbio、Nanopore)对生物细胞、组织、器官或者个体中所有转录和表达的基因进行测序。全长转录组测序的超长读长可获得mRNA全长序列及完整结构信息。克服无参考基因组物种转录本拼接短、信息不完整的难题,实现有参考基因组物种研究可变剪切及融合基因等结构变异。
基本测序和分析技术流程
全长转录组测序实验流程包括样品检测、文库构建和上机测序。
全长转录组实验流程图:
全长转录组分析流程图:
全长转录组分析内容详解
全长转录组分析的意义之于有参考基因组物种的意义在于可以校正现有的基因模型、发现新基因或者新的可变剪切形式以及进行融合基因分析;而对于无参考基因组物种,其主要意义在于可以构建较为完善的基因模型集,作为RNA-Seq定量分析的参考序列。有参或无参全长转录组分析内容见下表:
|
有参全长转录组分析条目 |
无参全长转录组分析条目 |
|
数据质控、转录本分类 |
数据质控、转录本分类 |
|
转录本聚类与校正 |
转录本聚类与校正 |
|
与参考基因组比对 |
七大转录本数据库注释 |
|
进行可变剪切分析 |
作为参考序列、定量分析 |
|
新基因预测 |
lncRNA预测 |
|
融合基因分析 |
编码蛋白框预测 |
|
作为参考序列,定量分析 |
|
|
编码蛋白框预测 |
|
|
lncRNA预测 |
|
服务流程
样品寄送 建库测序 数据分析 出具报告 售后答疑
样本要求
RNA样品:样品浓度≥ 100 ng/uL;总量≥5ug;样本无 DNA 及杂质污染,无降解或轻微降解, 满足 2 次或 2 次以上建库用量
生物样品:样品新鲜采集、快速超低温冷冻、干冰寄送。详细步骤根据样品特点和检测目的在采集和送样前咨询相关工作人员。
品科研技术服务咨询中心







