我使用的是PyG库,如果我们按照以下代码导入Cora数据集时往往会出现无法连接到下载地址处
from torch_geometric.datasets import Planetoid
dataset = Planetoid(root='./temp/Cora', name='Cora')
我们应该从Github上先下载好数据集,数据集地址:https://github.com/kimiyoung/planetoid
这里先放到一个文件中
将这里属于Cora的数据复制到你运行代码的那个文件夹中(我这里在Jupyter中运行,以其为例)
当我们运行
dataset = Planetoid(root='./temp/Cora', name='Cora')
时,我们的运行文件夹中就会出现这个路径
然后将刚才复制的文件放到里面的raw文件夹里
最后,我们再运行刚才的代码,数据集就加载好了。
其实,每当我们调用Planetoid这个类时,我们指定了一个路径,如果这个路径里面有下载好的数据集,那么函数会自动调用这个数据集里面的东西作为数据,否则就会下载数据到指定路径下,所以,我们可以把这个路径更改成我们喜欢的任意一个。
**
注意raw这个文件夹在路径中不需要指明,在函数调用数据时自动会从raw中寻找,所以如果路径里没有raw,执行语句时它也会创建一个raw文件夹
**