ncbi和ensembl上的序列下载

根据已有的基因ID,需要从ncbi和ensembl上下载对应序列。使用语言:python3

从ncbi上下载序列的话,python有一个对应的包,好像是ncbi官方支持的,就叫biopython,省去了去ncbi里找API。官方提供的是 https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi,附说明链接https://www.ncbi.nlm.nih.gov/books/NBK25499/#chapter4.EFetch
但是ensembl似乎没有支持的包,所以只能通过官方的API接口,叫rest,里面提供了各式各样的接口服务。(有关exon的信息在lookup的接口里)。

(另注:不知什么原因,代码最好在上午10点之前运行,这样就不会有问题;其他时间均会有问题。哭了)

时隔多年,发现其实有个更简单的方法,https://www.ncbi.nlm.nih.gov/sites/batchentrez?,但这个只能是小批量的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值