基于qiime2 扩增子分析结果进行LEfse差异物种进化关系和出图

LEfSe(LDA Effect Size)分析是一种将非参数的Kruskal-Wallis以及Wilcoxon秩和检验,与线性判别分析(Linear discriminant analysis,LDA)效应量(Effect size)相结合的分析手段。与MetagenomeSeq分析类似,LEfSe分析也是一种差异分析方法;但LEfSe分析可以直接对门/纲/目/科/属/种的各级分类水平同时进行统计检验和差异分析。同时,LEfSe更强调寻找分组之间稳健的差异物种,即标志物种(Biomarker)。它的一大特点是,不仅局限于对不同样本分组中的群落组成差异进行分析,更可以深入到不同的子分组(Subgroup)中,挑取在不同子分组中表现一致的标志微生物类群。

要基于 QIIME 2 的扩增子分析结果进行 Lefse 分析,你需要将 QIIME 2 生成的结果文件转换成 Lefse 能够处理的格式,然后使用 Lefse 工具进行统计分析。以下是大致的步骤:

步骤概述:

  1. 导出 QIIME 2 结果文件
  2. 转换结果文件格式为 Lefse 可处理格式
  3. 运行 Lefse 统计分析

环境安装

# bioconda安装
mamba create -n lefse -c bioconda lefse -y 

# 激活lefse环境
conda activate lefse 

# 查看输入数据格式化脚本
which lefse-format_input.py

转化最终结果到Level6

qiime taxa collapse \
    --i-table rst_table.qza \
    --o-collapsed-table collapse.table.qza \
    --p-level 6 \
    --i-taxonomy final_tax_sliva.qza

统计计算相对丰度

qiime feature-table relative-frequency \
    --i-table collapse.table.qza \
    --o-relative-frequency-table collapse.frequency.table.qza \
    --output-dir ./ 

导出biom文件

qiime tools export \
    --input-path collapse.frequency.table.qza \
    --output-path ./

将biom格式转换为普通文本

biom convert \
    -i feature-table.biom \
    -o collapse.frequency.table.tsv \
    --header-key "taxonomy" \
    --to-tsv

按tax水平过滤物种

sed 's/;/\|/g' collapse.frequency.table.tsv | \
    awk '{split($1, a, "|");if( a[6] != "__"){print $0}}' | \
    #sed 's/d\_\_Bacteria|//g' | \
    grep -vE "g__uncultured|d__Archaea|p__WPS-2|p__SAR324_clade|Constructed" | \
    sed 's/#OTU ID/Group/g;s/taxonomy//g' > collapse.frequency.table.lefse.tsv

运行lefse分析

lefse分析的输入文件大概格式:

前面两行是处理和分组,第三行是样品编号,第四行开始就是物种丰度了,第一列是物种名当然也可以是其他的,只要格式一致的数据都可以使用这个差异分析。

mamba activate lefse
# convert text file into lefse.input file 
# 数据输入format
lefse_format_input.py \
    collapse.frequency.table.lefse.tsv \
    collapse.frequency.table.lefse.in \
    -c 1 \
    -m f \
    -o 100000

# run lefse
run_lefse.py \
    collapse.frequency.table.lefse.in \
    collapse.frequency.table.lefse.res 

# select significant result Lefse
grep -E "HTN|Normal" \
        collapse.frequency.table.lefse.res \
        > collapse.frequency.table.lefse_signif.res

# plot lda 
lefse_plot_res.py \
    collapse.frequency.table.lefse_signif.res \
    lefse_final_lda.pdf \
    --format pdf \
    --autoscale 0

# plot cladogram 
lefse_plot_cladogram.py \
    collapse.frequency.table.lefse_signif.res \
    lefse_total_clado.pdf \
    --format pdf

 

  • 8
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
以下是一些可能有用的Qiime2 16S双端数据分析代码示例: 1. 导入数据 ``` qiime tools import \ --type 'SampleData[PairedEndSequencesWithQuality]' \ --input-path /path/to/fastq \ --input-format CasavaOneEightSingleLanePerSampleDirFmt \ --output-path paired-end-demux.qza ``` 2. 进行序列质量控制 ``` qiime quality-filter q-score-joined \ --i-demux paired-end-demux.qza \ --o-filtered-demux filtered-demux.qza ``` 3. 对序列进行去嵌合 ``` qiime vsearch join-pairs \ --i-demultiplexed-seqs filtered-demux.qza \ --o-joined-sequences joined-seqs.qza ``` 4. 进行序列去噪 ``` qiime deblur denoise-16S \ --i-demultiplexed-seqs joined-seqs.qza \ --p-trim-length 250 \ --o-representative-sequences rep-seqs-deblur.qza \ --o-table table-deblur.qza \ --o-stats deblur-stats.qza ``` 5. 进行OTU聚类 ``` qiime vsearch cluster-features-de-novo \ --i-sequences rep-seqs-deblur.qza \ --p-perc-identity 0.97 \ --o-clustered-table table-otu.qza \ --o-clustered-sequences rep-seqs-otu.qza ``` 6. 进行alpha和beta多样性分析 ``` qiime diversity alpha-group-significance \ --i-alpha-diversity shannon.qza \ --m-metadata-file metadata.txt \ --o-visualization shannon-group-significance.qzv qiime diversity beta-group-significance \ --i-distance-matrix unweighted_unifrac_distance_matrix.qza \ --m-metadata-file metadata.txt \ --m-metadata-column treatment \ --o-visualization unweighted-unifrac-group-significance.qzv ``` 7. 进行物种注释 ``` qiime feature-classifier classify-sklearn \ --i-classifier classifier.qza \ --i-reads rep-seqs-otu.qza \ --o-classification taxonomy.qza qiime metadata tabulate \ --m-input-file taxonomy.qza \ --o-visualization taxonomy.qzv ``` 这些代码示例应该可以帮助您开始使用Qiime2进行16S双端数据分析。请注意,您需要根据自己的数据和研究问题进行调整和修改。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小果运维

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值