使用Kaiju无组装计算宏基因组数据物种注释相对丰度

关于Kaiju

Kaiju是一款直接通过宏基因组数据Read获得物种注释信息并计算读数与相对丰度的软件。它的主要方法是将Read核酸序列翻译为蛋白序列然后在相应的数据库中进行精确比对,确认物种分类信息。

Kaiju 安装与数据库下载

Kaiju的安装可以参考其Github上给出的步骤。

由于Kaiju的运行需要参考数据库的比对,所以提前要下载好数据库,数据库可以通过kaiju-makedb命令下载。但是由于我这边不能直接用网关账号登录的服务器进行下载,所以是在组里对外服务器上下载的,可以去Kaiju web server下载,该页面左侧显示了下载链接,复制链接后使用wget命令就可以下载了。
我下载的数据库是:NCBI BLAST Nr库,下载下来后是tgz格式,用tar xzvf命令解压就可以了,解压后会得到3个文件:

names.dmp
nodes.dmp
kaiju_db_nr_euk.fmi

这三个文件需要在运行kaiju时指定,存好记下绝对路径就可以了。

Kaiju主程序

kaiju -z 64 -t ~/softwares/kaiju/kaijudb/nodes.dmp \
-f ~/softwares/kaiju/kaijudb/kaiju_db_nr_euk.fmi \
-i ~/hotspring/NGS/dedupe/1A_dedupe_R1.fq \
-j ~/hotspring/NGS/dedupe/1A_dedupe_R2.fq \
-o 1A.kaiju.out

-z参数调整线程数, -f对应刚才解压数据库得到的.fmi文件,然后-i -j分别是双端R1 R2序列文件,-o是输出文件。

输出结果用kaiju2table命令可以转化为容易处理的形式。

kaiju2table -t ~/softwares/kaiju/kaijudb/nodes.dmp \
-n ~/softwares/kaiju/kaijudb/names.dmp -u \
-o 1A.classification.summary.class.tsv -r class 1A.kaiju.out

-t -n分别指定刚才解压数据库得到的nodes.dmpnames.dmp-u代表unclassified的序列不加入相对丰度计算,-o是输出文件,-r可以填写phylum, class, order, family, genus, species,分别表示显示在这六种分类层级下的分类结果。最后一个参数是主程序的输出文件。

输出结果示例

在这里插入图片描述
上图就是kaiju2table的结果在Excel中的部分展示,这个输出是phylum水平的,显示了相对丰度以及序列数。

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

EmmettPeng

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值