缘起
起因我原来炼丹使用的是win10的子系统wsl来炼丹,但是当设置num_workers等于其他值时一直报错,只能够为0,这导致我的炼丹炉一直有很多空闲时间,数据喂不满。我在想着是不是和Windows的子系统的原因,所以就装了一个Ubuntu,整个双系统,结果报错依旧,这让我就很懵逼,不是Linux系统可以多进程取数据吗?在懵逼几天后再翻翻代码后终于有了思绪。
分析
如下dataset代码所示:
在dataset中,在报错以前我一直在dataset中将数据往GPU去送,就导致使用dataload使用多进程取数据就报错,我的猜想是:在训练过程中,num_workers等于其他值时,dataload就已经在一边准备数据等待下一轮的读取,而在准备的过程中如果还可以把数据往GPU加进去,那么肯定会爆内存,官方肯定不会没想到,所以报错了,而在当num_workers=0时,只有主进程取数据,而GPU在等待,这时候是可以把数据加载到GPU上去的。结论:只有当GPU空闲的时候才能往里面加载训练数据。
代码修改
在dataset中如上图“修改后代码”所示,往GPU加载改到如下图所示:
最后依旧使用的是WSL来炼丹,完美把炼丹炉喂满。
本人新手上道,有不对的地方请指教,也希望对遇到此问的伙伴有所帮助。