- 博客(4)
- 收藏
- 关注
原创 乱七八糟的问题记录
改代码的过程中更改了episode中的states列表内容(tensor数据类型),导致最后保存时states内容不是json支持直接序列化的对象,出现报错。解决办法:将两个state变量名区别开,分开保存。
2023-11-23 19:51:20 453
原创 这0卡就非要占一下吗?问你呢pytorch!
需要注意的是,在设置环境变量之后,第x,y块显卡在程序的眼里就变成了第0,1...块显卡,在后续使用中需要注意序号的问题,即如果程序有使用GPU的指令要求,比如gpu_ids=xxx时,要将xxx改为0,1...以此类推,不然会出现invalid device ordinal的错误。真服了,咱说就想跑个测试,无论怎么指定显卡,程序一跑起来都会在第0块显卡上占点内存。在输入训练指令前加上CUDA_VISIBLE_DEVICES=x,y(x,y为要使用的显卡,可指定多个显卡),,就不会使用第0块显卡了。
2023-11-02 11:05:39 68 1
原创 一些问题记录
仔细检查代码中模型路径,模型名称等正确与否。多数情况下是由于torch.load()时由于路径错误load不到文件。代码使用多进程训练,多个模型的optimizer要写到一起,用一个优化器优化。检察实例化模型时括号是否多打少打,括号中是否忘记参数args。以上均为个人遇到的问题解决记录,不完全适用于所有情况!其中,icm_model是新加入的模块。
2023-10-11 17:34:41 1020 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人