Linux下安装并运行TMHMM

TMHMM的安装与运行

0. 简介:

TMHMM是跨膜蛋白胞内区、跨膜区和胞外区识别软件,其在线网站为http://www.cbs.dtu.dk/services/TMHMM/

1. 下载:

https://services.healthtech.dtu.dk/service.php?TMHMM-2.0
在这里插入图片描述
下载对应的版本即可,此处以Linux为例。

2. 安装:

解压:tar -zxvf tmhmm-2.0c.Linux.tar.gz
切换目录:cd tmhmm-2.0c
确认bin/tmhmm 和 tmhmmformat.plperl的路径是否和Linux上的路径一致,如果不一致,改成自己perl的路径 (可以用which perl查看perl的安装路径)。

3. 运行:

假设bin/目录下有个名为test.fasta的文件,那么以它作为输入文件,运行TMHMM (运行命令:perl tmhmm test.fasta)。运行完成后会在该bin/目录下生成一个TMHMM开头的目录,目录中有两个文件(.gnuplot 和 .plp)。

4. 备注:

TMHMM默认会直接输出Long output format (如下所示):

可以用正则表达是对其中的区域进行获取。比如:获取所有outside的结果行:

## 以test.fasta为例
from subprocess import check_output
import os
import re

outfile = 'tm_outside.txt'
outF = open(outfile,'w')

os.chdir('tmhmm-2.0c/bin/')
tm_out = check_output('perl tmhmm test.fasta', shell=True)
tm_out = tm_out.decode()

patt = re.compile('([A-Z0-9]+)\s+TMHMM2.0\s+outside\s+(\d+)\s+(\d+)\n', re.MULTILINE)  ## 获取outside行
mth = patt.findall(tm_out)

if len(mth) != 0:
    for i in range(len(match)):
        outF.write('%s\t%s\t%s\n' % (match[i][0],match[i][1],match[i][2]))
else:
    print('%s' % tm_out)
  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值