我选的是gcn里R52数据集,由于数据量太大,笔记本内存有限,所以需要删一些数据让数据变小,主要是想看到完整的实验过程。首先,找到原始文档也就是gcn里面的corpus下R52数据集,这里面都是文档一行是一条数据,我保留了60条,然后更改data下的R52.text,这里面数据也是保留60条,但是要注意里面有test和train两种数据,我train保留了50条,test是10条,如果不注意把test全删掉会出现以下错误,ty的矩阵会出现问题。
删好后 运行text_gcn,x,y,tx,ty,allx,ally,shape结果如下:
运行后生成 ind.R52.adj文件和ind.R52.x,ind.R52.y,,ind.R52.tx,ind.R52.ty,ind.R52.allx,ind.R52.ally文件,处理完数据后把这些文件还有 R52.test.index粘到GAT项目data文件夹下,先要修改数据集路径,
找到test.index文件,然后运行提示我没有ind.R52.gr