pubchem使用说明

一、下载与安装

下载python包

pip install pubchempy

查看说明

help(pubchempy)

(二、使用说明

一、模块概述

pubchempy是用于 PubChem PUG REST 服务的 Python 接口,其源代码可在https://github.com/mcs07/PubChemPy获取。

二、主要类

  1. Assay

    • 代表 PubChem 中的一个实验记录。
    • 方法包括初始化、比较、转换为字典表示等。
    • 类方法可从 AID 检索实验记录。
    • 具有多种属性,如 aid、aid_version、comments、description、name、project_category、results、revision、target 等。
  2. Atom

    • 表示化合物中的一个原子。
    • 可设置和获取原子的属性,如原子 ID、原子序数、坐标和电荷等。
    • 具有将原子转换为字典表示等方法。
    • 具有 coordinate_type 和 element 等只读属性。
  3. BadRequestError

    • 继承自PubChemHTTPError,表示请求格式不正确。
  4. Bond

    • 代表化合物中两个原子之间的键。
    • 可操作键的属性,如起始和结束原子 ID、键序和键样式等。
    • 可转换为字典表示。
  5. BondType

    • 定义了不同键类型的常量。
  6. Compound

    • 对应 PubChem 化合物数据库中的单个记录。
    • 可从 CID 检索化合物记录。
    • 具有多种属性,如 aids、atom_stereo_count、atoms、bond_stereo_count、bonds、cactvs_fingerprint、canonical_smiles、charge、cid 等。
    • 可转换为字典或pandas.Series表示。
  7. CompoundIdType

    • 定义了化合物 ID 类型的常量。
  8. CoordinateType

    • 定义了坐标类型的常量。
  9. MethodNotAllowedError

    • 继承自PubChemHTTPError,表示请求不被允许。
  10. NotFoundError

    • 继承自PubChemHTTPError,表示输入记录未找到。
  11. ProjectCategory

    • 定义了项目类别的常量。
  12. PubChemHTTPError

    • 通用错误类,用于处理所有 HTTP 错误代码。
  13. PubChemPyDeprecationWarning

    • 用于警告已弃用的功能。
  14. PubChemPyError

    • 所有pubchempy异常的基类。
  15. ResponseParseError

    • 表示无法解析 PubChem 响应。
  16. ServerError

    • 继承自PubChemHTTPError,表示服务器端出现问题。
  17. Substance

    • 对应 PubChem 物质数据库中的单个记录。
    • 可从 SID 检索物质记录。
    • 具有多种属性,如 aids、cids、deposited_compound、sid、source_id、source_name、standardized_cid、standardized_compound、synonyms 等。
    • 可转换为字典或pandas.Series表示。
  18. TimeoutError

    • 继承自PubChemHTTPError,表示请求超时。
  19. UnimplementedError

    • 继承自PubChemHTTPError,表示请求的操作尚未实现。

三、函数

  1. compounds_to_frame(compounds, properties=None):从化合物对象列表构建pandas.DataFrame
  2. deprecated(message=None):装饰器,用于标记已弃用的函数。
  3. download(outformat, path, identifier, namespace='cid', domain='compound', operation=None, searchtype=None, overwrite=False, **kwargs):下载数据,格式可以是 XML、ASNT/B、JSON、SDF、CSV、PNG、TXT。
  4. get(identifier, namespace='cid', domain='compound', operation=None, output='JSON', searchtype=None, **kwargs):自动处理异步请求的请求包装器。
  5. get_aids(identifier, namespace='cid', domain='compound', searchtype=None, **kwargs)
  6. get_all_sources(domain='substance'):返回所有当前物质或实验的提交者列表。
  7. get_assays(identifier, namespace='aid', **kwargs):检索指定的实验记录。
  8. get_cids(identifier, namespace='name', domain='compound', searchtype=None, **kwargs)
  9. get_compounds(identifier, namespace='cid', searchtype=None, as_dataframe=False, **kwargs):检索指定的化合物记录,可转换为pandas.DataFrame
  10. get_json(identifier, namespace='cid', domain='compound', operation=None, searchtype=None, **kwargs):自动解析 JSON 响应并抑制NotFoundError的请求包装器。
  11. get_properties(properties, identifier, namespace='cid', searchtype=None, as_dataframe=False, **kwargs):检索指定的属性,可转换为pandas.DataFrame
  12. get_sdf(identifier, namespace='cid', domain='compound', operation=None, searchtype=None, **kwargs):自动解析 SDF 响应并抑制NotFoundError的请求包装器。
  13. get_sids(identifier, namespace='cid', domain='compound', searchtype=None, **kwargs)
  14. get_substances(identifier, namespace='sid', as_dataframe=False, **kwargs):检索指定的物质记录,可转换为pandas.DataFrame
  15. get_synonyms(identifier, namespace='cid', domain='compound', searchtype=None, **kwargs)
  16. memoized_property(fget):装饰器,用于创建记忆化属性。
  17. request(identifier, namespace='cid', domain='compound', operation=None, output='JSON', searchtype=None, **kwargs):构建 API 请求并返回响应。
  18. substances_to_frame(substances, properties=None):从物质对象列表构建pandas.DataFrame

四、数据

  1. API_BASE = 'https://pubchem.ncbi.nlm.nih.gov/rest/pug'
  2. ELEMENTS = {1: 'H', 2: 'He', 3: 'Li', 4: 'Be', 5: 'B', 6: 'C', 7: 'N',...}
  3. PROPERTY_MAP = {'atom_stereo_count': 'AtomStereoCount', 'bond_stereo_c...}
  4. __email__ = 'm.swain@me.com'
  5. __license__ = 'MIT'
  6. division = _Feature((2, 2, 0, 'alpha', 2), (3, 0, 0, 'alpha', 0), 1310...
  7. log = <Logger pubchempy (WARNING)>
  8. print_function = _Feature((2, 6, 0, 'alpha', 2), (3, 0, 0, 'alpha', 0)...
  9. text_types = (<class 'str'>, <class 'bytes'>)
  10. unicode_literals = _Feature((2, 6, 0, 'alpha', 2), (3, 0, 0, 'alpha',...

五、版本和作者

  1. VERSION = 1.0.4
  2. AUTHOR = Matt Swain
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值