在ChEMBL上爬取Protein Target Classification信息

朋友的朋友给了一堆ChEMBL类型,需求是获取对应的Protein Target Classification信息。

这个信息比较特殊,找了好一会才找到数据源。下面是获取步骤。

  1. 通过官方API的文档找到我们需要的API https://www.ebi.ac.uk/chembl/api/data/docs
  2. /chembl/api/data/target/search?q= 输入ChEMBL类型我们可以获得该类型下的ChEMBLID,在返回数据中找到任意一个ChEMBLID和对应的component_id
  3. /chembl/api/data/target_component/ 输入component_id,在返回数据中找到protein_classification_id,这个ID就是Protein Target Classification信息的类型
  4. /chembl/api/data/protein_class/ 最后用protein_classification_id找到该类型对应的Protein Target Classification信息

关键代码如下:

import requests
import bs4
import json
import re

Q_URL = "https://www.ebi.ac.uk/chembl/api/data/target/search?q={}"
COM_URL = "https://www.ebi.ac.uk/chembl/api/data/target_component/{}.json"
PRO_URL = "https://www.ebi.ac.uk/chembl/api/data/protein_class/{}.json"

def get_expid(id):
    # 获取某类型的一个ChEMBLID和component_id
    url = Q_URL.format(id)
    r = requests.get(url)
    soup 
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值