自然语言处理
fakerlove
这个作者很懒,什么都没留下…
展开
-
Pytorch多GPU训练踩坑记录
问题介绍使用nn.DataParallel进行多GPU并行训练时,对模型进行传参,出现报错“RuntimeError: chunk expects at least a 1-dimensional tensor”问题分析nn.DataParallel的作用是将模型和数据分配到各个GPU上,让其在各自的GPU上训练,首先检查batchsize是否是GPU数量的整数倍,以及dataloader是否设置了drop_last是否是true,如果没有drop_last,那么最后一个batchsize剩下的数量可原创 2021-06-09 09:39:38 · 1142 阅读 · 0 评论 -
我理解的第一篇顶会论文
Continual Relation Learning via Episodic MemoryActivation and Reconsolidation原创 2021-06-07 15:34:01 · 282 阅读 · 0 评论