产品简介

1998年,Handelsman首次提出了宏基因组学(或元基因组学,Metagenomics)概念,即运用测序技术,对样品中的全部微生物的DNA进行研究的技术。后来加利福尼亚大学伯克利分校的研究人员Kevin Chen和Lior Pachter将宏基因组定义为“应用现代基因组学技术,直接研究自然状态下的微生物有机群落,而不需要在实验室中分离单一菌株”的科学。宏基因组学可以从环境样品中提取出的全部微生物DNA出发,构建宏基因组文库,并利用测序技术进行DNA测序,再对测序数据进行分析,从而全面了解样品中所包含的全部微生物的组成信息和群落功能。

数据分析策略

1.数据质控:下机的原始数据(Raw Data)会存在一定比例的低质量数据,原始数据都必须进行严格质控;

2.宏基因组组装:基于Clean Data,先进行单个样本组装,再将各样本中未参与到组装的reads合并进行混合组装,以此增加低丰度物种的测序深度,获得更多的物种序列信息;

3.基因预测:基于单样本和混合组装的scaftigs,利用MetaGeneMark进行基因预测,对预测得到的所有基因进行去冗余,得到非冗余基因集;再将各样本的Clean Data 比对到该基因集上,统计获得基因集在各样本中的丰度表;

4.物种注释:基于质控得到的Clean Data,与NCBI 微生物的参考基因组数据库进行比对注释,获得各样本在不同分类层级的物种丰度表;

5.功能注释:基于非冗余基因集,与KEGG数据库进行比对注释,获得功能丰度表;

6.统计与分析:基于物种和功能丰度表,进行丰度柱状图、Krona、Heatmap、样本聚类分析、PCoA分析、Wilcoxon秩和检验分析、LEfSe多元统计分析以及代谢通路比较分析,挖掘样本(组)之间物种和功能组成的差异;

7.高级分析:基于以上宏基因组标准分析的结果,可选择进行一系列高级分析,例如NMDS、CCA/RDA、Network、CAG/MGS分析、肠型分析、抗性基因注释、拷贝数变异等分析;同时,可以结合宏转录组、宏代谢组以及宏蛋白组数据等进行多组学的关联分析。

数据分析内容

分析类别 分析内容
基因统计与分析 样本间基因分布Venn图 组间基因数目差异分析
样本基因α多样性分析
微生物群落分析 样品菌落组成柱状图 样品间相似性指数
PCoA分析
样品聚类分析
LEfSe分析
Wilcoxon秩和检验分析
物种分布Krona图
样本主要物种分布比较
Heatmap图
代谢通路分析(基于KEGG数据库) 样品代谢功能组成柱状图
Heatmap图
样品代谢通路分析
不同样品代谢通路比较分析
碳水化合物酶分析(基于CAZy数据库) 样品碳水化合物酶组成柱状图
Heatmap图
功能组成分析(基于eggNOG数据库) 样品功能组成柱状图
Heatmap图
高级分析菜单 RDA/CCA 分析 肠型分析
Network分析 CAG/MGS分析
单菌Binning组装 抗性基因注释
拷贝数变异分析

其他问题?

微信公众号

erweima