环境准备
500GB以上的ubuntu18.04
(library原本总共就有200多个GB 而我怀疑解压时生成的tmp文件会占用很多内存 还有taxonomy)
获得kraken2-master后安装命令为:
sudo ./install_kraken2.sh $install_dir
这里的install_dir自行设置
ubuntu环境下需要配置好cmake,gcc,g++。同时由于需要安装kraken2命令因此需要先安装上anaconda,然后配置conda环境kraken2
安装anaconda
使用firefox浏览器进入Anaconda官网:https://www.anaconda.com/
然后使用bash命令安装Anaconda
bash $anaconda-xxx.sh
这里的$anaconda-xxx.sh对应具体版本的anaconda的sh文件
阅读并接受安装协议,最后一步要注意
“Do you wish the installer to initialize Anaconda3 by conda init?[yes|no]”
这里是配置conda环境变量的地方,一定要回答yes,才是最终完成了anaconda的ubuntu系统配置。
然后使用
conda create -n kraken2 python=3.7
conda activate kraken2
pip install kraken2
完成kraken2环境配置
还有可能存在pip源不包含kraken2库的情况,我试着给pip换源却发现毫无成效,于是我给conda换源,然后使用以下命令进行换源。
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud//pytorch/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --set show_channel_urls yes
换源完成后我使用
conda install -y kraken2
conda install -y bracken
这样做安装必要的库.
安装数据库并完成索引
需要注意的是bacteria数据库很大,然后解压操作会占据很多空间,因此虚拟机要用500GB空间。
kraken2-build --download-library archaea --threads 24 --db dbdir
kraken2-build --download-library bacteria--threads 24 --db dbdir
kraken2-build --download-library viral--threads 24 --db dbdir
下载物种注释
下载索引文件
一些离谱的杂活
最搞笑的是装这个虚拟机所需要的kraken2库的时候,一度虚拟机无法开机,后来是从开机一直按住Shift 然后安全启动解决这个问题。
然后又遇到虚拟机断网,使用桥接模式解决此问题。