参考文献:https://www.jianshu.com/p/67137451b67f
NCI-1、NCI-109和MUTAG是关于化学分子和化合物的数据集,原子代表结点,化学键代表边。NCI-1和NCI-109数据集分别包含4100和4127个化合物,labels是判断化合物是否有阻碍癌细胞增长得性质。MUTAG数据集包含188个硝基化合物,labels是判断化合物是芳香族还是杂芳族。
文件格式
NCI-1、NCI-109和MUTAG数据集的文件构成如下:(用DS代替数据集名称)
n表示结点数,m表示边的个数,N表示图的个数
DS_A.txt (m lines):图的邻接矩阵,每一行的结构为(row, col),即一条边。
DS_graph_indicator.txt (n lines):表明结点属于哪一个图的文件。
DS_graph_labels.txt (N lines):图的labels。
DS_node_labels.txt (n lines):结点的labels。
DS_edge_labels.txt (m lines):边labels。
DS_edge_attributes.txt (m lines):边特征。
DS_node_attributes.txt (n lines):结点的特征。
DS_graph_attributes.txt (N lines):图的特征,可以理解为全局变量
作者:VTS三只小猪
链接:https://www.jianshu.com/p/67137451b67f
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
作者:VTS三只小猪
链接:https://www.jianshu.com/p/67137451b67f
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。