TUDataset: A collection of benchmark datasets for learning with graphs

TUDataset: A collection of benchmark datasets for learning with graphs
GitHub:https://github.com/chrsmrrs/tudataset

2.TUDATASET集合包含www.graphlearning.io上提供的120多个数据集。

2.1 Datasets

Small molecules. 小分子。一类常见的图形数据集由带有类别标签的小分子组成,代表例如药物发现项目中确定的毒性或生物活性。这里,一个图代表一个分子,即节点代表原子,边代表化学键。因此,标签编码原子和键的类型,可能有额外的化学属性。图形模型不同,例如,氢原子是否由节点明确表示,芳香环中的键被相应地注释。
Bioinformatics生物信息学。数据集DD, ENZYMES 以及PROTEINS代表大分子。Borgwardt等人(2005年)介绍了一种蛋白质的图形模型,其中节点代表二级结构元素,并由它们的类型,即螺旋、薄片或转弯,以及几个物理和化学信息来注释。如果两个节点是氨基酸序列的邻居或者是空间中三个最近的邻居之一,则一条边连接两个节点。使用这种方法,数据集酶来自BRENDA数据库(Schomburg等人,2004年)。在这里,任务是将酶分配到6个EC顶级类别之一,这反映了催化的化学反应。类似地,数据集蛋白质来源于(Dobson & Doig,2003),任务是预测蛋白质是否是酶。Shervashidze等人(2011年)使用的数据集DD基于相同的数据,但包含图形,其中节点表示单个氨基酸,边缘表示它们的空间邻近性。
temporal graphs最近,Oettershagen等人(2019)考虑了时间图,其中边缘表示两个个体在某个时间点的接触或相互作用。在研究传播过程时,例如流行病、谣言或假新闻的传播,这些图表很有意义。我们提供了从TUMBLR (Rozenshtein等人,2016)、DBLP和FACEBOOK (Viswanath等人,2009)以及麻省理工学院(Eagle & Pentland,2006)、一所高中的学生和传染病展览(Isella等人,2011)的参观者之间的联系中获得的时态图形分类数据集。

5.实验评估

数据集。我们使用了DEEZER_EGO_NETS、GITHUB _ STARGAZERS、ENYMES、IMDB-BINARY、IMDB-MULTI、MCF-7、MOLT-4、NCI1、PROTEINS、REDIT-BInary、REDDIT_THREADS、TWITCH_EGOS、UACC257图形分类数据集。此外,我们还使用了ALCHEMY、QM9、ZINC(多目标)回归数据集。数据集统计见网站和附录中的表4。我们选择不使用小数据集的连续节点特征(如果可用)和ALCHEMY数据集的3D坐标,只提供基于图形结构和离散标签的基线结果。在QM9数据集的情况下,我们紧密复制了Gilmer等人(2017)的(连续)节点和边缘特征。
在这里插入图片描述

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
HPO-B是一个基于OpenML的大规模可复现的黑盒超参数优化(HPO)基准。超参数优化是机器学习中非常重要的一环,它涉及在给定的模型框架下选择最优的超参数配置,以提高模型的性能和泛化能力。 HPO-B基准的目的是为了提供一个可靠且可复现的平台,用于评估不同HPO方法的效果。通过使用OpenML作为基础数据集和算法库,HPO-B能够提供广泛的机器学习任务和模型,从而覆盖不同领域的实际应用。 HPO-B基准的黑盒性质意味着它仅仅观察模型的输入和输出,而不考虑模型内部的具体实现。这种设置模拟了现实世界中许多机器学习任务的情况,因为在实际应用中,我们通常无法获得关于模型的全部信息。 HPO-B基准旨在解决现有HPO方法的一些挑战,例如难以比较和复制不同方法之间的实验结果。它通过提供标准任务、固定的训练-验证-测试数据分割方式和一致的评估协议,使得不同方法之间的比较更加公平和可靠。 通过使用HPO-B基准,研究人员和从业者可以在统一的实验环境中进行黑盒超参数优化方法的评估和对比。这有助于推动该领域的发展,促进更好的超参数优化算法的提出和运用。 总而言之,HPO-B是一个基于OpenML的大规模可复现的黑盒超参数优化基准,旨在解决现有方法比较困难和结果复现性差的问题,并推动超参数优化算法的发展。它为机器学习任务提供了一个统一的实验平台,以评估不同方法在不同领域的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值