整理了之前的QIIME 2 学习总结,挑选了非常基础实用的部分做一个QIIME 2 学习大礼包(没错就是这篇文章)。对基础分析的流程来说内容涵盖非常全。
我觉得很适合当作工具书来使用_(:з)∠)_
如果有帮到你请给一个赞哦~👍
下载这篇文章的 PDF 版随时查阅:QIIME2扩增子分析流程及常用命令.pdf
以下是正文内容:
必看:
-
QIIME 2 官方论坛(非常有用哦)
-
使用该页面查看 QIIME 2 的 qzv 后缀可视化文件
-
QIIME 2 官方文档:
【中文参考】
【英文原版】 https://docs.qiime2.org/2020.11/
官方文档会隔几个月更新一次,而我不会同步更新链接, 点链接进去戳【Latest Docs】按钮就好啦。每个版本的更新内容在官方论坛里可以找到。😊 -
推荐一看的参考教程(中文版):
QIIME 2用户文档.4人体各部位微生物组分析实战Moving Pictures -
QIIME 2 安装教程:https://docs.qiime2.org/2020.6/install/
一、将16S 数据导入QIIME 2
1. 生成原始数据的file path文件
该文件包含首行、每个样本的 ID、rawreads文件路径、forward或reverse信息。
首行必须是:sample-id,absolute-filepath,direction
文件格式示例:
2. 导入QIIME2
输入:路径文件
输出:demux-summary.qza
单端数据使用命令:
qiime tools import --type 'SampleData[SequencesWithQuality]' --input-path input-path-list.tsv --output-path single-end-demux.qza --input-format SingleEndFastqManifestPhred33
双端数据使用命令:
qiime tools import --type 'SampleData[PairedEndSequencesWithQuality]' --input-path input-path-list.tsv --output-path demux-summary.qza --input-format PairedEndFastqManifestPhred33
生成qzv可视化文件查看数据质量:
qiime demux summarize --i-data demux-summary.qza --o-visualization demux-summary.qzv
二、降噪(Denoise)流程
这里罗列Deblur与Dada2两种方式,实际应用可以二选一。据说dada2速度更快,而且,我自己的实验测试表明 dada2 更加准确。
这些降噪方法滤除有噪声的序列,校正边缘序列中的错误(仅在 Dada 2 的分析中)、去除嵌合序列、去除偶然序列(singletons,即:出现频率仅有一次的序列)、合并去噪后的双端序列(仅在Dada 2 的分析中),然后对这些序列进行去冗余。
1. Deblur 流程
(1)先使用QIIME 2的 vsearch 接口做join pairs
根据两端序列末端的互补配对,可以合并为我们扩增区域的序列,同时还可以对重叠区的质量进行校正,保留最高测序质量的碱基结果。
qiime vsearch join-pairs --i-demultiplexed-seqs demux-summary.qza --o-joined-sequences joined.qza
生成可视化文件,查看其join后的长度及质量。
qiime demux summarize --i-data joined.qza --o-visualization joined.qzv
(2)按测序碱基质量过滤序列
输入:拼接后的qza文件
输出:
demux-filtered.qza:序列质量过滤后结果。
demux-filter-stats.qza:序列质量过滤后结果统计。
单端数据使用命令:
qiime quality-filter q-score --i-demux demux.qza --o-filtered-sequences demux-filtered.qza --o-filter-stats demux-filter-stats.qza
双端数据使用命令:
qiime quality-filter q-score-joined --i-demux joined.qza --o-filtered-sequences joined-filtered.qza --o-filter-stats joined-filtered-stats.qza
分别生成可视化qzv文件:
joined-filtered.qzv
qiime demux summarize --i-data joined-filtered.qza --o-visualization joined-filtered.qzv
joined-filtered-stats.qzv
qiime metadata tabulate --m-input-file joined-filtered-stats.qza --o-visualization joined-filtered-stats.qzv
joined-filtered-stats.qzv示例图
(3)降噪
自设参数解释:
–p-trim-length: 通常,Deblur开发人员建议将该值设置为质量分数中位数开始下降至低质量区时的长度。
输入:拼接过滤后的qza文件
输出:
deblur-stats.qza: 过程统计
table-deblur.qza: 特征表
rep-seqs.qza: 代表序列
使用命令示例:
qiime deblur denoise-16S --i-demultiplexed-seqs joined-filtered.qza --p-trim-length 250 --o-representative-sequences rep-seqs.qza --o-table table.qza --p-sample-stats --o-stats deblur-stats.qza
分别生成可视化qzv文件:
- 过程统计表:
qiime deblur visualize-stats --i-deblur-stats deblur-stats.qza --o-visualization deblur-stats.qzv
- feature table:
特征表汇总(可视化)命令 feature-table summarize ,提供每个样品和每个特性相关联的序列数量、这些分布的直方图以及一些相关的汇总统计数据信息。
qiime feature-table summarize --i-table table.qza --o-visualization table.q