- 博客(15)
- 收藏
- 关注
原创 pytorch训练时的显存占用递增,out of memory
pytorch进行训练的时候,占用的显存总是不停的上涨,直到out of memory,检查训练日志,发现reserved memory远大于allocated memory,而且allocated memory会波动但不会稳定上涨,reserved memory会稳定上涨。在记录损失的时候,把整个tensor变量给保存了下来,这就导致在完成一次前向推理和反向传播之后,由于损失tensor被保留了下来,导致计算图无法被正常销毁,因此导致reserved memory不停增大。查过资料后发现是损失值的问题。
2024-10-28 11:50:05 229
原创 将conda虚拟环境迁移到新的服务器上
由于服务器系统崩了,需要新建环境,就把之前备份的conda虚拟环境传到了服务器上,这里迁移的只是envs文件。迁移完成后,首先要修改虚拟环境下的pip文件。把最上面那行的路径改成新位置的路径。和现系统的不一致,需要替换成现系统的。完成之后激活虚拟环境,运行。,这是因为虚拟环境对应的。
2024-04-19 16:55:42 595 1
原创 使用Git,误把大文件加入本地暂存区
在使用github管理项目的时候,不小心在.gitignore中黏贴了一段论文中的内容,导致commit时本应被git忽略的几个大文件夹被加入了本地缓存区,导致push失败。
2024-04-15 15:41:35 242
原创 使用pytorch的distributeddataparallel遇到GPU0显存不均衡
使用pytorch的distributeddataparallel遇到GPU0显存不均衡
2024-01-15 21:47:02 443
原创 maskrcnn_benchmark 报错 target = target.resize(image.size)--->‘list‘ object has no attribute ‘resize‘
在maskrcnn_benchmark执行train_net.py的时候报了一个错误:‘list’ object has no attribute ‘resize’。
2022-07-07 11:20:20 711 1
原创 python打包成的exe自动打开拖拽到其上的文件
用pyinstaller打包成exe文件拖入该exe程序,windows会将文件名作为程序的第2个参数import sysfilename = sys.argv[1]下面是你打开文件的逻辑[1]: https://ask.csdn.net/questions/917588?spm=1005.2026.3001.5635&utm_medium=distribute.pc_relevant_ask_down.none-task-ask-2defaultOPENSEARCHRate-1-917588-a
2022-06-30 09:49:01 1193
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人