图分类任务常用数据集

在这里插入图片描述

  1. D&D 在蛋白质数据库的非冗余子集中抽取了了1178个高分辨率蛋白质,使用简单的特征,如二次结构含量、氨基酸倾向、表面性质和配体;其中节点是氨基酸,如果两个节点之间的距离少于6埃(Angstroms),则用一条边连接。(DD数据集中节点是没有标签的,节点只有特征)
  2. PROTEIN 则是另一个蛋白质网络。任务是判断这类分子是否酶类。
  3. NCI-1 是关于化学分子和化合物的数据集,节点代表原子,边代表化学键。NCI-1包含4100个化合物,任务是判断该化合物是否有阻碍癌细胞增长的性质。
    用于抗癌活性分类的生物学数据集。在数据集中,每个图形代表一种化学化合物,节点和边分别代表原子和化学键。其中NCI1是针对非小细胞肺癌的活性筛选,NCI109是针对卵巢癌细胞的活性筛选。
  4. FRANKENSTEIN 是一组分子图,其节点特征包含连续值。标签表示分子是诱变剂还是非诱变剂。
    [基准数据集涉及文章Kersting, K., Kriege, N. M., Morris, C., Mutzel, P.,and Neumann, M. Benchmark data sets for graph kernels, 2016.]
    [这里的数据集 是对于sagpool 的基准数据集,SAGPool是一种基于自注意的新型图池化方法。具有以下特征:分层池化,同时考虑节点特征和图拓扑,合理的复杂性以及端到端表示学习。无论输入图形的大小如何,SAGPool都会使用一致数量的参数。所以说节点需要有特征]
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值