文章目录
文章目录
一、前言
RepeatMasker是一款专门用于基因组重复序列识别注释,并分类统计的软件,几乎用于所有物种。是研究基因组、非编码RNA、转座子和着丝粒领等相关领域的必备软件。
本文安装参考一:RepeatMasker(一)——安装及使用
本文安装参考二:RepeatMasker/INSTALL
本文主要讲述大致安装过程,具体使用帮助见下一章:RepeatMasker的安装与使用(二)
二、软件安装
1.RMBlast序列搜索引擎
#本地下载后进行安装
cd /home/ghost/software
tar zxvf ncbi-blast-2.11.0+-src.tar.gz
mv ncbi-blast-2.11.0+-src ./rmblast
gunzip isb-2.11.0+-rmblast.patch.gz
cd rmblast
patch -p1 < ../isb-2.11.0+-rmblast.patch
cd c++
./configure --with-mt --prefix=/home/ghost/software/rmblast --without-debug
make
# 安装程序及库至系统目录,有报误,但我们需要的rmblastn已经可以正常使用了
sudo make install # Makefile:40: recipe for target 'install-toolkit' failed
# 测试程序是否安装成功
/home/ghost/software/rmblast/c++/ReleaseMT/bin/rmblastn -h
2.TRF(Tandem Repeat Finder)搜寻串联重复序列
https://tandem.bu.edu/trf/trf.download.html
#需要先查看本设备的GLIBC 版本
ldd --version
#选择Tandem Repeats Finder 4.09 for 64 bit Linux(GLIBC version >= 2.14)进行本地下载
cd /home/ghost/software
mkdir TRF
chmod +x trf409.linux64
sudo cp trf409.linux64 /home/ghost/software/TRF/trf
# 测试是否有帮助信息即可用
./trf -h
3.RepeatMasker程序
http://www.repeatmasker.org/RMDownload.html
#选择Latest Released Version: 04/1/21: RepeatMasker-4.1.2-p1.tar.gz进行本地下载后
#注意该版本的注解:Patch 1: Releases 4.1.1-4.1.2 contained a bug with the processing of Alu sequences in primates. The step where an initial annotation is refined into a particular Alu subfamily was not performed and the annotations remained labeled with the initial capture sequence ( AluJb, AluSx, or AluY ).
cd /home/ghost/software
tar xvzf RepeatMasker-4.1.2-p1.tar.gz
4.Repbase数据库
https://www.girinst.org/server/RepBase/index.php
#进行本地下载后
cd /home/ghost/software
mv RepBaseRepeatMaskerEdition-20181026.tar.gz ./RepeatMasker
cd RepeatMasker/
tar xvzf RepBaseRepeatMaskerEdition-20181026.tar.gz
5.配置RepeatMasker依赖关系
#进行本地下载后
cd /home/ghost/software/RepeatMasker
chmod -R 755 *
./configure #执行后,根据提示信息,依次添加perl、trf、选择2 RMBlast的安装绝对路径,最后选择5 done
#配置环境变量
export PATH=/home/ghost/software/RepeatMasker:$PATH
#查看帮助检测安装是否成功
RepeatMasker -h
常见报错一:
如果反复提示以下关于“Text::Soundex module”模块的错误(即便你这个perl模块确实安装好了),不用强行安装,因为作者表明RepeatMasker issues74现在已经不依赖Text/Soundex了,报错的那一行注释之后就可以正常运行,而且最新版本的RepeatMasker已经修复了这个bug。
常见报错二:
本人在安装时遇到Python h5py模块缺失的问题,只要安装一下这个模块,然后再重新设置RepeatMasker依赖环境就行
#安装pip安装工具
sudo apt update
sudo apt install python3-pip
python3-pip --version #查看版本顺便检验pip是否安装成功
sudo pip install h5py