• CLC  肠道菌群宏基因组数据分析

CLC 肠道菌群宏基因组数据分析

软件要求:CLC Genomics Workbench 10.0版本及以上(或Biomedical Genomics Workbench 4.0及以上),和CLC Microbial Genomics Module 2.0版本及以上。演示数据来自文献:Antibiotic selection pressure determination through sequence-based metagen

软件要求CLC Genomics Workbench 10.0版本及以上(或Biomedical Genomics Workbench 4.0及以上),和CLC Microbial Genomics Module 2.0版本及以上。

演示数据来自文献Antibiotic selection pressure determination through sequence-based metagenomics. [Willmann et al., 2015]

演示数据下载:在workbench中使用Search for Reads in SRA tool下载ERP011645,或者使用浏览器下载http://resources.qiagenbioinformatics.com/testdata/taxpro.zip,约900M

案例:两位健康男性(S1S2),连续服用抗生素环丙沙星(antibiotic ciprofloxacin, Cp6天,然后分别取不同时间的的粪便样本,服用前0天(day 0);服用期间的第1天(day 1)、第3天(day 3)和第6天(day 6);服用期后的第2天(day 8)和第28day 34)天。使用Illumina HiSeq 2000测序:paired-end 测序方法,reads长度为100bp,插入大小为180bp。本次分析演示,仅以day 0day 6 day 34的样本数据分析来给大家展示肠道微生物种群的组成是如何随着药物治疗的进度而发生变化的,以及治愈完成后的恢复情况。

操作流程

1. 数据导入。导入6NGS Reads及数据预处理;导入微生物基因组的参考数据库;导入metadata

2. Taxonomic profiling。使用Data QC and Taxonomic Profiling Workflow构建每个样本的细菌组分谱,并赋予富集值。

3. 统计学分析。使用Merge and Estimate Alpha and Beta Diversities Workflow 合并6个样本的细菌富集结果为一个表,比较样本间和样本内的菌群多样性,以及构建Heat map

 

1. 数据导入

1.1 Import | Illumina 导入12条测序文件,选择Paired reads,勾选Discard read names Discard quality scores,勾选Paired-end (forward-reverse),长度设置为50bp500bp(或使用默认的距离,软件在后续的计算中会重新计算所有reads的距离)。点击Next,选择保存位置,完成。

1489310668277296.jpg1.2 Import | Import Metadata,选择Metadata_Willman.xlsx,点击Next,选择所有已导入的测序reads,匹配方式选择"Partial",点击Next,保存,完成。这个metadata表格中记载了样本的分组信息。

1489310254101425.jpg

1489310254791311.jpg1.3 Import | Standard import导入Reference database.clc,这是一个参考基因组序列数据库,里面共有1476条全基因组序列。

 2. Taxonomic profiling

Taxonomic Profiler tool可以把每一条Read map到数据库中参考基因组序列上,并指定reads的分类单元(taxon),最后对得到的每一个分类单元(taxon)给出富集置。

2.1 打开名为Samples的这个metadata table,下方单击Find Associated Data,这时会在下方出现一个窗口,会把所有相关联的文件显示在这个地方,选中所有的样本。

1489310254122825.jpg2.2 Metagenomics | Taxonomic Analysis | Workflows | Data QC and Taxonomic Profiling6个样本已经默认被选中,勾选Batch选项,点击Next"Batch overview"对话框中确定样本是否选择无误,点击Next,可对测序reads进行修剪,本文所用数据已经进行过了修剪,点击Next,指定参考数据库为Reference database,此处也可选择去除来自寄主的测序reads,比如经常会去除人的DNA干扰,本文不指定寄主,点击Next,选择保存位置,完成。

1489310255315035.jpg1489310255873975.jpg2.3 运行完成后,会得到每个样本的分析结果,如下:

1489310255992829.jpg

3. 统计学分析

3.1 在进行统计学分析以前,首先要把每个样本的结果合并到一个文件中,然后才可以进行Alpha Beta 多样性分析。在metadata中,选中6个样本,单击Find Associated Data,在结果列表中,单击表头"Role",排序所有相关的结果,选中6个类型为"Abundance table"的文件。

1489310256291325.jpg3.2 Metagenomics | Taxonomic Analysis | Workflows | Merge and Estimate Alpha and Beta Diversities6个样本的Abundance table已经默认被选中,点击Next,在Alpha Diversity analysis中仅勾选Total number,在下一步的Beta Diversity analysis中仅勾选Bray-Curtis,选择保存位置,完成。

1489310258109907.jpg

3.3 运行完成后,得到下面三个结果:

1489310255137946.jpg

3.4 打开merged 这个文件,在右边的setting中,设置DataAggregate feature下拉选框中为Classs,也就是说在分类学-纲水平查看所有样本的细菌富集情况,选中得到的这6行,单击下方的Create Abundance Table from Selection,此时会得到一个新的文件叫做Merged (Filtered)

1489310256312410.jpg3.5 Metagenomics | Abundance Analysis | Create Heat Map for Abundance Table,选择merged (Filtered) tabledistance选择1-Pearson correlationclustering选择Average linkage,在Filter中选择"No filtering",点击Next,保存,完成。

1489310256440903.jpg 1489310257983319.jpg

结果解读:

Alpha- diversity analysis

打开名为merged (Alpha Diversity - Total number) 的分析结果,可以看到反应细菌种群数量和测序reads数量的Rarefaction curves plot,目的是判断是否有足够的测序深度。从曲线结果可以看出,基本所有样本的物种多样性都已达到了一个平台期,基本可以反映两人肠道中的微生物多样性情况。

1489310257939512.jpg结论:

1. S1S2有更高的基底细菌多样性;

2. S1的肠道微生物在服用药物期间明显发生了紊乱,在服药期的最后一天(day 6)有最低的多样性。

3. S2相对受到的影响较小,三个样本的多样性基本维持不变。

 

Beta-diversity analysis

打开名为merged (PCoA - Bray-Curtis)的分析结果,在右边的设置中改Sphere colorSubject,改Label txtDay

1489310257128725.jpg结论:

1. S1S2是明显不同的两组;

2. 每组的基底多样性(day 0)样本和最后恢复状态(day 34)样本都是紧密靠近的,但来自服药期(day 6)的样本是明确不同的,这说明药物会改变微生物种群多样性,服药后经过一定时间也可得到恢复。

3. 服药期,S1的肠道微生物紊乱看起来似乎比S2的更明显,因为它在第1和第2坐标轴上的偏离要更远一些。

 

其它可视化结果:

Abundance table

打开名为mergedabundance table文件,在左下角的visualization options中选择Stacked Visualization,在右边的设置中,选择chart type Bar chart sort samples by subject

从这个柱形图中,可以看出服药前,S1的肠道微生物多样性要比S2的更高;在服药期间,S1S2的肠道微生物多样性降低到几乎仅有厚壁菌门和拟杆菌门;在恢复后,发现S1的肠道微生物组分与服药前相比发生了质的变化,恢复后多了疣微菌门 (Verrucomicrobiae) (灰色)。

1489310257439354.jpg单击左下角的饼图视图方式,可进一步调查每个样本的菌群多样性。选择"Aggregate samples by Subject",然后选择不同的分类学等级来探索样本的微生物多样性。

 

Heat map

1489310257475931.jpg结论:

1. 来自服药前和恢复后的样本被聚类到一起,它们相对很相似,但两个个体之间的肠道微生物非常不同。

2. S2中没有疣微菌门(Verrucomicrobia),而S1的疣微菌门增多了。

 

如果您对此文感兴趣,欢迎加入 CLC 软件的学习交流群:175136595

关注微信