使用
这个项目训练时一直报错,用的时从csdn能下载到的数据集,原网已经不提供数据了。
目前做出的努力:
1、由于源码老旧,能使用的pytorch需要更新一些函数的调用方式,才能避免运行前期报错。
类似:
loss.data[0]换成loss.item()
view(-1)换成reshape(-1)
直到修改到运行时期不会报错为止。
2、从csdn下载到的vggface2数据集,其中的identity_meta.csv文件中,有19条数据的格式与其他不一致,我改成一致后,仍旧不能阻止上面的报错(不改也一样,但是不改的话遍历文件的时候不会显示label)
3、训练过程监督gpu使用率,一直处于50~60%,不高于5G的样子。所以修改batch_也没用。
做出这些修改后,训练了10小时仍旧报如上错。
谁能告诉我怎么修改?