python读取关键字_基于Python的关键字获取蛋白质FASTA序列

最新推荐文章于 2024-05-18 11:13:56 发布

weixin_39595537

最新推荐文章于 2024-05-18 11:13:56 发布

阅读量568

点赞数

文章标签： python读取关键字

我想从Python中收集来自Entrez的蛋白质FASTA序列2.7。我正在寻找其名称中含有关键字“terminase”和“large”的任何蛋白质。到目前为止，我得到这个代码：基于Python的关键字获取蛋白质FASTA序列

from Bio import Entrez

Entrez.email = "[email protected]"

searchResultHandle = Entrez.esearch(db="protein", term="terminase large", retmax=1000)

searchResult = Entrez.read(searchResultHandle)

ids = searchResult["IdList"]

handle = Entrez.efetch(db="protein", id=ids, rettype="fasta", retmode="text")

record = handle.read()

out_handle = open('myfasta.fasta', 'w')

out_handle.write(record.rstrip('\n'))

但是它可以让我从各种生物的几个terminases，而我只需要terminase形式噬菌体(specificly病毒[taxid 10239]，宿主菌我已经成功地得到。 nuccore加入IDS从我位数的在NCBI的病毒，但我不知道如何这两个信息结合标识文件看起来是这样的：

NC_001341

NC_001447

NC_028834

NC_023556

...

我需要访问的每GB的文件每个ID并在其中搜索我想要的蛋白质？

2017-07-25

tahunami

+0

嗨，尝试在生物信息学的网站上张贴这样的：https://bioinformatics.stackexchange.com/ –

+0

我不能在40分钟内张贴：/连接这些网站某种方式？ –

weixin_39595537

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python读取关键字_基于Python的关键字获取蛋白质FASTA序列

我想从Python中收集来自Entrez的蛋白质FASTA序列2.7。我正在寻找其名称中含有关键字“terminase”和“large”的任何蛋白质。到目前为止，我得到这个代码：基于Python的关键字获取蛋白质FASTA序列from Bio import EntrezEntrez.email = "[emailprotected]"searchResultHandle = Entrez.ese...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。