python读取关键字_基于Python的关键字获取蛋白质FASTA序列

我想从Python中收集来自Entrez的蛋白质FASTA序列2.7。我正在寻找其名称中含有关键字“terminase”和“large”的任何蛋白质。到目前为止,我得到这个代码:基于Python的关键字获取蛋白质FASTA序列

from Bio import Entrez

Entrez.email = "[email protected]"

searchResultHandle = Entrez.esearch(db="protein", term="terminase large", retmax=1000)

searchResult = Entrez.read(searchResultHandle)

ids = searchResult["IdList"]

handle = Entrez.efetch(db="protein", id=ids, rettype="fasta", retmode="text")

record = handle.read()

out_handle = open('myfasta.fasta', 'w')

out_handle.write(record.rstrip('\n'))

但是它可以让我从各种生物的几个terminases,而我只需要terminase形式噬菌体(specificly病毒[taxid 10239],宿主菌我已经成功地得到。 nuccore加入IDS从我位数的在NCBI的病毒,但我不知道如何这两个信息结合 标识文件看起来是这样的:

NC_001341

NC_001447

NC_028834

NC_023556

...

我需要访问的每GB的文件每个ID并在其中搜索我想要的蛋白质?

2017-07-25

tahunami

+0

嗨,尝试在生物信息学的网站上张贴这样的:https://bioinformatics.stackexchange.com/ –

+0

我不能在40分钟内张贴:/连接这些网站某种方式? –

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值