【QIIME2】单端数据Deblur

QIIME2学习

QIIME2分析之单端数据的导入与Deblur



前言

当fastq数据质量信息不完整/单一时,无法使用DADA2降噪——DADA2的算法不允许质量是一个值的,DADA2去重复直接是基于自己的数据本身,所以对质量要求严格
而这种数据可以用 Deblur 运行—— Deblur 算法不一样,Deblur 去重复的时候会参考数据库,但对数据库的完整度要求就比较高了,不然可能舍弃掉比较多的序列

为了使用质量信息有问题的fastq数据(前提是数据已经质控过,只是在NCBI上下载的数据质量信息有问题),我们使用 Delbur 替代 DADA2 降噪

一、导入数据

qiime tools import \
  --type 'SampleData[SequencesWithQuality]' \
  --input-path config.txt \
  --output-path  mjsample.qza \
  --input-format SingleEndFastqManifestPhred33V2

查看文件的原始数据的序列数等信息

qiime demux summarize \
  --i-data mjsample.qza \
  --o-visualization mjsample.qzv

导出qzv文件查看

qiime tools export --input-path mjsample.qzv --output-path mjsample_statistic

二、Deblur

1.按测序碱基质量过滤序列

time qiime quality-filter q-score \
  --i-demux mjsample.qza \
  --o-filtered-sequences demux-filtered.qza \
  --o-filter-stats demux-filter-stats.qza

输出结果文件:
demux-filtered.qza: 序列质量过滤后结果;
demux-filter-stats.qza: 序列质量过滤后结果统计。
48条序列用时5分多

2.去噪16S过程

deblur去噪16S过程,输入文件为质控后的序列,设置截取长度参数,生成结果文件有代表序列、特征表、样本统计。

time qiime deblur denoise-16S \
--i-demultiplexed-seqs demux-filtered.qza \
--p-trim-length 300 \
--o-representative-sequences rep-seqs-deblur.qza \
--o-table deblur-table.qza \
--p-sample-stats \
--o-stats deblur-stats.qza

输出结果文件:
deblur-table.qza 特征序列丰度表
rep-seqs-deblur.qza 特征序列文件
deblur-stats.qza 质控、去噪、去嵌合体后剩下的序列文件#查看每个样品剩余有效序列数(丰度表)—统计的文件
此处时间长,48条序列用时37分钟

3.输出文件可视化

质控、去噪、去嵌合体的统计结果#打开deblur-stats里的index.html查看

time qiime metadata tabulate \
  --m-input-file demux-filter-stats.qza \
  --o-visualization demux-filter-stats.qzv
time qiime deblur visualize-stats \
  --i-deblur-stats deblur-stats.qza \
  --o-visualization deblur-stats.qzv
qiime tools export --input-path deblur-stats.qzv --output-path deblur-stats
qiime tools export --input-path demux-filter-stats.qzv --output-path demux-filter-stats

质控、去噪、去嵌合体的统计结果#打开deblur-stats里的index.html查看

其他表格结果查看

质控、去噪、去嵌合体的统计结果#打开deblur-stats里的index.html查看

time qiime feature-table tabulate-seqs \
  --i-data rep-seqs-deblur.qza \
  --o-visualization rep-seqs-deblur.qzv
time qiime feature-table summarize \
  --i-table deblur-table.qza \
  --o-visualization deblur-table.qzv \
  --m-sample-metadata-file sample.tsv
time qiime tools export --input-path deblur-table.qzv --output-path deblur-table_stat

导出特征序列文件

qiime tools export --input-path rep-seqs-deblur.qza --output-path rep-seqs-deblur

导出txt格式的丰度表

qiime tools export --input-path deblur-table.qza --output-path deblur-table
biom convert -i deblur-table/feature-table.biom -o asv_deblur-table.txt  --table-type "OTU table" --to-tsv

4.结果解读

在这里插入图片描述deblur-table_stat中的sample-frequency-detail.html
框住的一列代表测序深度
多样性时 一般选取最小的;最小值格外小,则去除最小值选最小的


补充说明

如果使用deblur-16S,deblur执行初始的正向过滤步骤,其中它丢弃与85% GreenGenes 数据库中OTU的序列小于60%相似性的任何序列。如果不想执行此步骤,请使用deblur-other方法。

deblur目前只能对单端序列进行去噪。如果提供末合并的双端序列为输入,将对反向序列不作任何操作。请注意,deblur接受合并的序列,并将它们视为单端序列,因此如果使用deblur进行去噪,需要先合并读取。

qiime deblur COMMANDS
Usage: qiime deblur [OPTIONS] COMMAND [ARGS]...

Description: This QIIME 2 plugin wraps the Deblur software for performing
sequence quality control.

Plugin website: https://github.com/biocore/deblur
Getting user support: Please post to the QIIME 2 forum for help with this
plugin: https://forum.qiime2.org

Commands:
denoise-16S:      ​
Deblur sequences using a 16S positive filter.
​denoise-other :   
Deblur sequences using a user-specified positive filter.
​visualize-stats :
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是一些可能有用的Qiime2 16S双端数据分析代码示例: 1. 导入数据 ``` qiime tools import \ --type 'SampleData[PairedEndSequencesWithQuality]' \ --input-path /path/to/fastq \ --input-format CasavaOneEightSingleLanePerSampleDirFmt \ --output-path paired-end-demux.qza ``` 2. 进行序列质量控制 ``` qiime quality-filter q-score-joined \ --i-demux paired-end-demux.qza \ --o-filtered-demux filtered-demux.qza ``` 3. 对序列进行去嵌合 ``` qiime vsearch join-pairs \ --i-demultiplexed-seqs filtered-demux.qza \ --o-joined-sequences joined-seqs.qza ``` 4. 进行序列去噪 ``` qiime deblur denoise-16S \ --i-demultiplexed-seqs joined-seqs.qza \ --p-trim-length 250 \ --o-representative-sequences rep-seqs-deblur.qza \ --o-table table-deblur.qza \ --o-stats deblur-stats.qza ``` 5. 进行OTU聚类 ``` qiime vsearch cluster-features-de-novo \ --i-sequences rep-seqs-deblur.qza \ --p-perc-identity 0.97 \ --o-clustered-table table-otu.qza \ --o-clustered-sequences rep-seqs-otu.qza ``` 6. 进行alpha和beta多样性分析 ``` qiime diversity alpha-group-significance \ --i-alpha-diversity shannon.qza \ --m-metadata-file metadata.txt \ --o-visualization shannon-group-significance.qzv qiime diversity beta-group-significance \ --i-distance-matrix unweighted_unifrac_distance_matrix.qza \ --m-metadata-file metadata.txt \ --m-metadata-column treatment \ --o-visualization unweighted-unifrac-group-significance.qzv ``` 7. 进行物种注释 ``` qiime feature-classifier classify-sklearn \ --i-classifier classifier.qza \ --i-reads rep-seqs-otu.qza \ --o-classification taxonomy.qza qiime metadata tabulate \ --m-input-file taxonomy.qza \ --o-visualization taxonomy.qzv ``` 这些代码示例应该可以帮助您开始使用Qiime2进行16S双端数据分析。请注意,您需要根据自己的数据和研究问题进行调整和修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值