开源的生物信息世界居然有这么个需要注册才能下载的工具,开源世界不是怎么方便怎么来吗?
这个注册真的麻烦,这里上传了一个可以使用的版本。
RepBaseRepeatMaskerEdition-20170127.tar.gz
想转成fasta可以用如下命令:
awk -f awk.sh RMRBSeqs.embl > raw.fasta cat raw.fasta | cut -f1-9 -d' '| sed -e 's/ID //g' | sed -e 's/repeatmasker\;//g'| sed -e 's/ //g' > RepBase.fasta
其中awk.sh文件内容为:
/^ID/ {printf(">%s;",$0); next;} /^(PT|PA)/ {printf(" %s;",$0); next;} /^\/\// {printf("\n"); next;} /^ / {printf("\n%s",substr($0,5)); next;} { /* ignore default */ } END { printf("\n"); }