更新中……
-
- 前言
- pytorch环境配置
- 项目环境配置
- 论文算法梳理
- 梳理项目代码
- 项目运行中的问题
-
-
- 1.RuntimeError: [enforce fail at ..\c10\core\CPUAllocator.cpp:76] data. DefaultCPUAllocator: not enough memory: you tried to allocate 1252845152 bytes.
- 2.OSError: [WinError 1455] 页面文件太小,无法完成操作。
- 3.RuntimeError: DataLoader worker (pid(s) 7792, 6020, 9748, 13556, 13640, 9148, 14076) exited unexpectedly
-
前言
最近在搞毕设推荐系统,找到了GMCF的源码,第一次尝试用pytorch进行深度学习相关的研究,记录一下过程中遇到的问题。
(先主要按现在的进度记录,之前的一些问题,看之后有没有时间好了)
pytorch环境配置
项目环境配置
论文算法梳理
梳理项目代码
code文件夹中主要有四个.py文件:
- main.py
- dataloader.py
- train.py
- model.py
个人梳理用,估计比较啰嗦。
main.py
其中最主要的为main.py,也是代码运行的入口。
略过最开始的参数设置之后,就开始调用dataloader.py文件,对保存的原始数据文件进行处理,构建图数据文件Dataset(相当于是Data对象的合集)。
dataloader.py
重点是用了torch_geometric这个库。
文件中的Dataset类继承了InMemoryDataset(也是torch_geometric中的一个方法),方便我们构造图数据集。
Dataset类中主要有四个函数(方法):raw_file_names(),processed_file_names(), download(), process()。前两个函数分别返回原始数据的文件路径和处理后的数据的文件路径。download函数主要是用来下载原始数据文件。process函数主要是用来处理数据。
程序运行流程:1.检查数据原始文件是否已下载;2.检查数据是否经过处理(检查processed文件夹下的文件是否存在),若不存在:调用process()方法,进行数据处理。
我们第一次调用该文件的时候,当然数据没有经过处理呀,调用该py文件的目的就是为了构造图数据集。(当图数据集构造完毕后,再调用该py文件