DeepChem的内置数据集及使用方法

本文介绍了DeepChem中内置的MoleculeNet数据集及其使用方法。MoleculeNet包含大量分子数据,目前共有46个数据集。通过示例展示了如何加载特定数据集并访问其特征、标签等。

'''

by wufeil

DeepChem的内置数据集及使用方法
Tutorial 3: An Introduction To MoleculeNet

Deepchem含有大量的内置数据集,主要是一些分子的数据,所以,数据集的名字为:MoleculeNet (分子网络)
数据集一直在更新,目前已经有46个数据集,

deepchem的数据集包含在molnet模块内, 使用load_+模块名称加载数据
如下:
'''

import deepchem as dc

tasks, datasets, transformer = dc.molnet.load_delaney(featurizer='GraphConv', splitter='random')
trainset, validset, testset = datasets
for X, y, w, ids in testset.itersamples():
    '''
    X-特征
    y-标签
    w-样本权重
    ids- ID
    
    注:
        datasets已经将训练集、验证集、测试集分开了
        数据集testset不是可以直接迭代的对象,要testset.itersamples()才可以
        具体请见:https://blog.csdn.net/wufeil7/article/details/110631024?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522160732181019721940220137%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=160732181019721940220137&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_v2~rank_v29-3-110631024.pc_v2_rank_blog_default&utm_term=deepchem&spm=1018.2118.3001.4450
    '''
    print(X, y, w, ids)

Deepchem中内置的数据集:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DrugAutoPilot

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值