产品简介 Product Introduction
泛基因组(Pan-genome)是指某一物种所有个体基因组的总和,涵盖核心基因组和可变基因组两部分。目前泛基因组主要是以新一代测序数据(三代测序PacBio或Nanopore)为基础,运用相应的生物信息学技术进行组装和构建。从整体策略上,主要分为以下三种,第一种是对所有材料进行基因组从头组装, 通过从头组装的基因组进行相互比较来构建泛基因组;第二种是以已有的参考基因组为基础,提取基因组非冗余序列并进行组装,通过“比对-组装”的迭代过程或者通过类似“宏基因组”的混池组装进行构建;第三种是基于变异图(variation graph)的组装方法,该方法为泛基因组提供了全新的概念和数据结构,相对于线性的基因组概念和变异展示形式,泛基因组图更适合于变异数据的组织和展示,以及下游的遗传变异分析,具有非常广阔的应用前景。
材料选择 Materials Selection
通常选取同一个种不同品种或者不同地理种群的代表种进行全基因组de novo,基于组装注释好的基因组再做泛基因组分析。
测序策略 Sequencing Strategy
单个材料测序要求跟动植物基因组de novo一样。
测序类型 | 平台 | 测序深度/数据量 | 备注 |
调研图测序 | Illumina/BGI | 50X | |
三代测序 | Pacbio Revio | 30X | 复杂基因组深度建议做到40X以上 |
Hic测序 | Illumina/BGI | 150X | |
转录组辅助注释 | Illumina/BGI | 6gb/样品 | 不同组织尽量都取到,有利于基因组注释,如植物需把根、茎、叶、花、果实、种子等材料取全 |
分析内容 Analysis Content
1、单个基因组组装注释分析
(1) 基因组调研图
(2) 下机数据过滤与统计
(3) 基于二三代数据的基因组组装
(4) 组装结果的评估
(5) 染色体构建(基于HiC数据)
(6) 基因组注释
2、泛基因组分析
(1) Pan-genome构建
(2) Graph Genome构建
(3) Pan-genome饱和度分析
(4) 核心基因家族(Core-gene)、非必须基因基因家族(Dispensable-gene)及特有基因家族(Specific-gene)分布统计
(5) 基因家族饱和度分析
(6) 基因家族PAV分析
(7) SNP检测及注释
(8) INDEL检测及注释
(9) SV检测及统计
(10) PAV检测(插入和缺失)及统计
(11) 变异区域基因的GO和KEGG富集
津ICP备2025029719号-1
微信

业务咨询
电话
返回顶部