pytorch模型加速

wanghua609

于 2020-06-18 15:58:30 发布

阅读量7.8k

点赞数 6

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38145317/article/details/106836616

版权

一个关键的原则：”仅仅在权重更新的时候使用fp32,耗时的前向和后向运算都使用fp16.",其中的一个技巧是，在反向计算开始前，将dloss乘上一个scale,人为变大，权重更新前，除去scale,恢复正常值。目的是为了减小激活gradient下溢出的风险。

fp16:半精度

如何在pytorch中使用fp16混合精度训练呢？

nn.Module中的half()方法将模型中的float32转化为float16,实现的原理是遍历所有tensor,而float32和float16都是tensor的属性，也就是说，一行代码解决，如下

model.half()

总结：

1、深度学习训练使用16bit表示/运算正逐渐成为主流。

2、低精度带来了性能、功耗优势，但需要解决量化误差（溢出，舍入）

3、常见的避免量化误差的方法：为权重保持高精度fp32备份，损失放大，避免梯度的下溢出，一些特殊层(如batchnorm)仍使用fp32运算。

博客等级

码龄8年

421
原创

1664
点赞

5682
收藏

345
粉丝

关注

私信

热门文章

最新评论

向日葵远程控制linux/window安装
joseph1314520: 还有Linux版本10.0的安装包吗
python 字典defaultdict(list)
満湫: [code=python] result = {} for (key, value) in data: if key not in result: result[key] = [] result[key].append(value) [/code] 以小弟的拙见。第一个方法感觉可以改成，先判断键在不在这个result里，如果不在，就在这个键对应位置创一个空列表，用来装那些数据。防止报错
python 字典defaultdict(list)
満湫: Traceback (most recent call last): File "D:\Work_APP\Anconda\envs\motionbert\lib\site-packages\IPython\core\interactiveshell.py", line 3457, in run_code exec(code_obj, self.user_global_ns, self.user_ns) File "<ipython-input-31-a115a0c08eff>", line 3, in <module> result[key].append(value) AttributeError: 'int' object has no attribute 'append'
python 字典defaultdict(list)
満湫: 第一个方法不太行呀
向日葵远程控制linux/window安装
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。