显存和GPU的关系有点类似于内存和CPU的关系
显存占用 = 模型显存占用 + batch_size × 每个样本的显存占用
模型大小:全连接很大,Embedding层很大,会导致模型很大
1)节省显存的方法:
- 降低batch-size
- 下采样(NCHW -> (1/4)*NCHW)
- 减少全连接层(一般只留最后一层分类用的全连接层)
显存和GPU的关系有点类似于内存和CPU的关系
显存占用 = 模型显存占用 + batch_size × 每个样本的显存占用
模型大小:全连接很大,Embedding层很大,会导致模型很大