Kraken2+Bracken:宏基因组物种注释

Bracken+Kraken2免费教学你爱了么,在csdn看了两篇都要钱。。。我非要白吃!

Kraken2安装参考:Kraken 2 Manual

Kraken2+Bracken - 简书 (jianshu.com)

Kraken2:宏基因组快速物种注释神器_刘永鑫Adam的博客-CSDN博客

kraken2安装

#看大佬推荐用conda安装,那就用conda把,到时候崩溃了再说
conda create -n kraken2_Bracken
conda activate kraken2_Bracken

#去看看最新的kraken2版本
https://anaconda.org/bioconda/repo #搜索kraken2
conda install -c "bioconda/label/cf201901" kraken2

#先创建一个database文件夹
mkdir database
cd database
mkdir kraken2

#看看安装成功没有
kraken2 --version
Kraken version 2.0.7-beta #好像不是最新版本

#重新安装最新版
conda install kraken2=2.1.3 #官网说2.1.3是最新版
kraken2 --version
Kraken version 2.1.3 #ok

#默认数据库安装(70G左右,非常的久,非常的久,非常的久)
kraken2-build --standard --threads 180 --db /home/zhongpei/database/kraken2/Standard/

#KrakenTools安装
#在https://github.com/jenniferlu717/KrakenTools下载所有python代码
chmod +x (代码绝对路径)
(代码绝对路径)-h
#完成

失败案例 (其实挺方便的,就是下载文件怕出错,可以试试用这个方法下小一点的Standard库)

################################################################################
#下载数据库nt Database(480G,下载的文件解压失败,有条件的大家可以试试看)
https://benlangmead.github.io/aws-indexes/k2 #数据库位置
wget -b #后台下载
tail -f wget-log #查看进度
wget -t 0 -c -b https://genome-idx.s3.amazonaws.com/kraken/k2_nt_20230502.tar.gz
wget -t 0 -c -b https://genome-idx.s3.amazonaws.com/kraken/nt_20230502/inspect.txt #这个没什么用
#下载完是“k2_nt_20230502.tar.gz”文件
tar zxvf k2_nt_20230502.tar.gz
#解压的文件应该就是索引好的kraken2的database了
################################################################################

完成!

kraken2 --db /home/zhongpei/database/kraken2/Standard \
--threads 90  --report kraken2.reprot \
--output kraken2.output --confidence 0.6 --paired r1.fq r2.fq

结果不太行,只有30%左右的contig被kraken2注释了,难绷

 使用krakentools将多个样本的kraken2-report合并起来

(完整路径)/KrakenTools/combine_kreports.py -r report1 report2 report3 \ 
-o combine_report.txt --display-headers \ 
--sample-names sample1 sample2 sample3

  • tot_all:这个分类分支(包括更具体的分支)的总读取数。也就是说,这个数包括了在这个分支及其所有子分支中找到的读取数。

  • tot_lvl:这个分类分支的总读取数,但不包括更具体的分支。也就是说,这个数只包括了直接在这个分支中找到的读取数,不包括在其子分支中找到

Bracken安装

官网:GitHub - jenniferlu717/Bracken: Bracken (Bayesian Reestimation of Abundance with KrakEN) is a highly accurate statistical method that computes the abundance of species in DNA sequences from a metagenomics sample.

#源码安装
git clone https://github.com/jenniferlu717/Bracken.git
cd Bracken
bash install_bracken.sh
cd src/ && make
/home/zhongpei/Bracken/bracken-build -v

最新版安好了

#建库
/home/zhongpei/Bracken/bracken-build -d /home/zhongpei/database/kraken2/Standard -t 180
#运行
/home/zhongpei/Bracken/bracken -d /home/zhongpei/database/kraken2/Standard -i kraken2.report -o bracken.output -w bracken.report -l S 

#使用KrakenTools转化Bracken的report
/home/zhongpei/Bracken/KrakenTools/kreport2mpa.py -r bracken.report   -o bracken.new.report

 结果有啦!

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值