16S扩增子Qiime2。从fq,fastqc等格式文件到OTU table(更详细)

平台:Ubuntu Linux平台上进行。

在进行16S扩增子实验前,我们需要安装好fastqc,相关教程在我的其他文档,如:在Linux中的qiime2。安装一天的fastqc,找到最好的解决办法-CSDN博客

一、文件要求:1、fq,fastqc等格式。

2、mapping.txt。linux中的示例:

3、manifest.txt,linux中示例:

 以上文件存放在同一个文件夹里并命名为dna_data.

二、1、激活qiime2。conda activate qiime2-amplicon-2023.9#(qiime2-amplicon-2023.9为你下的版本)

2、在qiime2的根目录中开始进行命令操作。

3、 输入文件 user@user:~$ qiime tools import \
--type 'SampleData[PairedEndSequencesWithQuality]' \
--input-path /home/user/dna_data/manifest.txt \
--output-path result/paired-end-demux.qza \
--input-format PairedEndFastqManifestPhred33

(/home/user/dna_data/manifest.txt  绝对路径可以防止报错,下文输入的路径全是绝对路径)
成功标志:Imported /home/user/dna_data/manifest.txt as PairedEndFastqManifestPhred33 to result/paired-end-demux.qza

三、以下操作都在cd result的文件下进行操作

1、 去除引物序列(本人的数据不知道引物序列,因此没做)

引用原话:

本测序数据的引物为338F和806R, p-front-f和p-front-r处分别输入自己的F和R端引物序列。

nohup time qiime cutadapt trim-paired \
--i-demultiplexed-sequences paired-end-demux.qza \
--p-front-f ACTCCTACGGGAGGCAGCA \
--p-front-r GGACTACHVGGGTWTCTAAT \
--o-trimmed-sequences paired-demux.qza

2、创建可视化文件查看数据

user@user:~/result$ qiime demux summarize \
--i-data paired-end-demux.qza \
--o-visualization demux.qzv
成功标志:Saved Visualization to: demux.qza.qzv

3、data2降噪、序列质量控制、构建特征表和代表序列表

 人家老大哥原话,更好理解:在qiime2网站中查看上一步得到的paired-demux.qzv,得到碱基质量值下降位点,使用p-trunc-len-f和p-trunc-len-f切除质量差的碱基。

user@user:~/result$ time qiime dada2 denoise-paired \
--i-demultiplexed-seqs paired-end-demux.qza \
--p-trunc-len-f 228 \
--p-trunc-len-r 215 \
--o-table table.qza \
--o-representative-sequences rep-seqs.qza \
--o-denoising-stats denoising-stats.qza
成功标志:Saved FeatureTable[Frequency] to: table.qza
Saved FeatureData[Sequence] to: rep-seqs.qza
Saved SampleData[DADA2Stats] to: denoising-stats.qza

4、查看去噪过程统计

user@user:~/result$ qiime metadata tabulate \
 --m-input-file denoising-stats.qza \
 --o-visualization denoising-stats.qzv
成功标志:Saved Visualization to: denoising-stats.qzv

5、查看统计特征表

user@user:~/result$ qiime feature-table summarize \
 --i-table table.qza \
 --o-visualization table.qzv \
 --m-sample-metadata-file /home/user/dna_data/mapping.txt

(/home/user/dna_data/mapping.txt。绝对路径)
成功标志:Saved Visualization to: table.qz

6、①.导出feature table

user@user:~/result$ qiime tools export  --input-path table.qza  \
--output-path feature_table
成功标志:Exported table.qza as BIOMV210DirFmt to directory feature_table

user@user:~/result$ biom convert -i feature_table/feature-table.biom  \
-o feature_table/feature-table.txt  --to-tsv

示例:

②. 计算relative frequency,并导出feature table

相关性: ser@user:~/result$ qiime feature-table relative-frequency --i-table table.qza \
--o-relative-frequency-table table-relative.qza
成功标志:Saved FeatureTable[RelativeFrequency] to: table-relative.qza

导出feature table:user@user:~/result$  qiime tools export  --input-path table-relative.qza  \
--output-path feature_table_relative
成功标志:Exported table-relative.qza as BIOMV210DirFmt to directory feature_table_relative

 user@user:~/result$ biom convert -i feature_table_relative/feature-table.biom  \
-o feature_table_relative/feature-table_relative.txt  --to-tsv

示例:

 为了以防以后忘记物种注释,本人将前人的记录摘抄下来,如下:

下载已建好的silva分类器:

由于训练Silva分类器需要花费大量时间,而Qiime2官网有已训练好的分类器,我们就用现成的了。本文使用的分类器为Silva 138按99%相似度聚类OTUs的全长序列。如果测序数据的引物序列为515F和806R,可以选择Silva 138按99% OTUs聚类V4区515F/806R的序列。

wget -c https://data.qiime2.org/2023.9/common/silva-138-99-nb-classifier.qza

生成物种注释表

nohup time qiime feature-classifier classify-sklearn \
 --i-classifier silva-138-99-nb-classifier.qza \
 --i-reads rep-seqs.qza \
 --o-classification taxonomy.qza &

可视化物种注释表

time qiime metadata tabulate \
 --m-input-file taxonomy.qza \
 --o-visualization taxonomy.qzv

 参考链接:1、Qiime2分析16S扩增子:从conda环境配置到生成OTU表 - 知乎 (zhihu.com)

                   2、3-下机数据的标准化处理(上)_哔哩哔哩_bilibili

  • 31
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
16s扩增子分析是一种用于研究微生物多样性的常见分析方法。该方法基于16s rRNA基因,通过扩增目标片段并进行高通量测序来获得微生物群落的组成信息。以下是16s扩增子分析的流程: 1. DNA提取:从样品中提取总DNA,例如土壤、水、粪便等。DNA提取的目的是将微生物细胞中的DNA分离并纯化,为后续的扩增和测序做准备。 2. 16s rRNA扩增:使用特定引物对16s rRNA基因的V3-V4区域进行扩增。这个区域具有足够的变异性,可以用于区分不同的微生物类群。 3. 准备文库:将扩增产物进行处理,如加上barcode,接上测序引物等。文库的准备是为了后续的高通量测序。 4. 高通量测序:将准备好的文库送入高通量测序仪中进行测序。现在常用的测序平台有Illumina MiSeq和Ion Torrent PGM等。 5. 数据分析:对测序得到的数据进行丰度和多样性分析。使用生物信息学的工具和数据库,如QIIME、mothur、MG-RAST等,可以对序列进行质量控制、聚类、分类等处理,从而得到微生物群落的组成和多样性信息。 6. 结果解读:根据数据分析的结果,可以了解微生物群落的组成和相对丰度,了解其多样性指标,如物种多样性指数、丰富度指数和均匀度指数等。这些结果可以用于比较不同样品间的差异,探索微生物生态系统的变化规律。 总之,16s扩增子分析是一种通过扩增和测序16s rRNA基因来研究微生物多样性的方法。通过该方法,可以揭示微生物群落的组成和结构,为进一步的微生物生态学研究和应用提供重要的信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值