kraken2安装+使用(超详细)

[lijing@master ~]$ cd lijing202110
[lijing@master lijing202110]$ mkdir kraken2
[lijing@master lijing202110]$ cd kraken2
[lijing@master kraken2]$ conda install -y kraken2

在这里插入图片描述

##Wget下载文件并解压
[lijing@master kraken2]$ wget https://github.com/DerrickWood/kraken2/archive/master.zip
[lijing@master kraken2]$ unzip master.zip

在这里插入图片描述
在这里插入图片描述

[lijing@master kraken2]$ ll
总用量 224
drwxrwxr-x 2 lijing lijing     10 10月 19 11:06 kraken2
drwxrwxr-x 6 lijing lijing    241 5月  10 14:11 kraken2-master
-rw-rw-r-- 1 lijing lijing 227378 10月 19 11:01 master.zip
[lijing@master kraken2]$ cd kraken2
[lijing@master kraken2]$ ll
总用量 0
[lijing@master kraken2]$ cd ..
[lijing@master kraken2]$ cd kraken2-master
[lijing@master kraken2-master]$ ll
总用量 32
-rw-rw-r-- 1 lijing lijing 5786 5月  10 14:11 CHANGELOG.md
-rw-rw-r-- 1 lijing lijing  618 5月  10 14:11 CMakeLists.txt
drwxrwxr-x 2 lijing lijing  310 5月  10 14:11 data
drwxrwxr-x 2 lijing lijing  165 5月  10 14:11 docs
-rwxr-xr-x 1 lijing lijing 1265 5月  10 14:11 install_kraken2.sh
-rw-rw-r-- 1 lijing lijing 1084 5月  10 14:11 LICENSE
-rw-rw-r-- 1 lijing lijing 2258 5月  10 14:11 README.md
drwxrwxr-x 2 lijing lijing 4096 5月  10 14:11 scripts
drwxrwxr-x 2 lijing lijing 4096 5月  10 14:11 src
[lijing@master kraken2-master]$ ./install_kraken2.sh /home/lijing/lijing202110/kraken2/kraken2

在这里插入图片描述
Kraken 2 installation complete.

To make things easier for you, you may want to copy/symlink the following
files into a directory in your PATH:

  /home/lijing/lijing202110/kraken2/kraken2/kraken2
  /home/lijing/lijing202110/kraken2/kraken2/kraken2-build
  /home/lijing/lijing202110/kraken2/kraken2/kraken2-inspect
[lijing@master kraken2-master]$ ll

配置环境变量:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
安装完成:
在这里插入图片描述
版本:
在这里插入图片描述
Kraken2说明:
在这里插入图片描述

/home/lijing/lijing202110/kraken2/kraken2
/home/lijing/lijing202110/kraken2/db/kraken2/20211018
/home/lijing/lijing202110/kraken2/db/kraken2/20211019

创建标准库:

[lijing@master kraken2]$ mkdir -p /home/lijing/lijing202110/kraken2/db/kraken2/20211018
[lijing@master 20211018]$ kraken2-build --standard --threads 24 --db /home/lijing/lijing202110/kraken2/db/kraken2/20211018

在这里插入图片描述
还是有问题:
重建标准库:
在这里插入图片描述
出现结果显示:rsync_from_ncbi.pl: unexpected FTP path (new server?) for https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/762/265/GCF_000762265.1_ASM76226v1
解决上面出现的问题:https://github.com/DerrickWood/kraken2/issues/508

后台下载:

[lijing@master kraken2]$ nohup kraken2-build --use-ftp --standard --threads 24 -                       -db /home/lijing/lijing202110/kraken2/db/kraken2/standard &

可用 jobs -l 进行窗口查看
使用ps 和top关闭窗口后进行查看
在cd的文件中出现说明文件:
在这里插入图片描述
还是出现问题:
gzip: nucl_gb.accession2taxid.gz: invalid compressed data–format violated
在这里插入图片描述
1.上面出现问题:建立个人库:

/home/lijing/lijing202110/kraken2/db/kraken2/private

下载taxonomy分类学注释:
先下载真菌库:
在这里插入图片描述
Viral:
在这里插入图片描述
建立索引:
在这里插入图片描述
2.建立非标准的most库失败:
在这里插入图片描述
3.建立标准库:分别下载古菌archaea、细菌bacteria、人类human、载体UniVec_Core、病毒viral这些库然后再下索引:
在这里插入图片描述
在这里插入图片描述
结果:因为标准库较大,可以被分类的序列更多,2%左右被分类
在这里插入图片描述
在这里插入图片描述
用个人库private(个人库里有viral和fungi)进行测试fasta文件(27.6m):

[lijing@master private]$ kraken2 --db /home/lijing/lijing202110/kraken2/db/kraken2/private /home/lijing/lijing202110/20211019test-data/NY_test.fa

在这里插入图片描述
在这里插入图片描述
用个人库private测试fastq文件(45.8m):
在这里插入图片描述
结果:因为库比较小只有较少的序列被分类
在这里插入图片描述
结果: 输出classify序列和unclassify序列以及一个.kraken文件

[lijing@master ~]$ kraken2 --db /home/lijing/lijing202110/kraken2/db/kraken2/private --fastq-input /home/lijing/lijing202110/20211019test-data/NY_test.fq --classified-out /home/lijing/lijing202110/20211019test-data/NY_test/output_classify --unclassified-out /home/lijing/lijing202110/20211019test-data/NY_test/output_unclassify> /home/lijing/lijing202110/20211019test-data/NY_test/NY_test.kraken

在这里插入图片描述
在这里插入图片描述
输出结果:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
输出报告:三个文件
在这里插入图片描述
用标准库测试原始raw_fastq.gz文件:

(base) [lijing@master ~]$ kraken2 --threads 10 --db /home/lijing/lijing202110/kraken2/db/kraken2/standard  --fastq-input --gzip-compressed /home/lijing/lijing202110/20211019test-data/NY_rawdata.fq.gz --classified-out /home/lijing/lijing202110/20211019test-data/NY_raw/output_classify --unclassified-out /home/lijing/lijing202110/20211019test-data/NY_raw/output_unclassify> /home/lijing/lijing202110/20211019test-data/NY_raw/NY_raw.kraken

结果:有77%被识别
在这里插入图片描述
报告输出:
在这里插入图片描述

(base) [lijing@master NY_raw]$ cat /home/lijing/lijing202110/20211019test-data/NY_raw/NY_raw.kraken | head -n 20
或(base) [lijing@master NY_raw]$ sed -n '1,20p' /home/lijing/lijing202110/20211019test-data/NY_raw/NY_raw.kraken

查看前20行
在这里插入图片描述
其他:
测试文件上传:
使用psftp失败:
在这里插入图片描述
使用filezilla进行上传:
在这里插入图片描述
打开即可上传:
在这里插入图片描述
转换fastq-fasta格式:

awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' fastq > fasta

失败的情况:
中途断掉似乎下不了文件:
在这里插入图片描述
查看数据库的情况:

[lijing@master ~]$ kraken2-inspect --db /home/lijing/lijing202110/kraken2/db/kraken2/private    | head -5

在这里插入图片描述
附加:
写在结尾中的情况:
在这里插入图片描述
https://ccb.jhu.edu/software/kraken2/index.shtml?t=downloads
查看内存所占大小:

[lijing@master standard]$ du -bsh /home/lijing/lijing202110

在这里插入图片描述
建好标准库需要standard需要199g:

[lijing@master ~]$ du -bsh /home/lijing/lijing202110/kraken2/db/kraken2/standard
199G    /home/lijing/lijing202110/kraken2/db/kraken2/standard

在这里插入图片描述
去掉后台的某个任务:
去掉某个任务用kill -9 任务名,可以去掉某个任务
[lijing@master ~]$ kill -9 106825
在这里插入图片描述
使用[lijing@master ~]$ rm -rf /home/lijing/lijing202110/kraken2/db/kraken2/standard/library,删除文件夹
在这里插入图片描述

  • 25
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值