pytorch 半精度，提升pytorch推理性能

最新推荐文章于 2024-04-12 09:11:12 发布

AI算法网奇

最新推荐文章于 2024-04-12 09:11:12 发布

阅读量1.1w

点赞数 8

分类专栏： pytorch知识宝典

原文链接：https://blog.csdn.net/zhou_438/article/details/115971686

版权

pytorch知识宝典专栏收录该内容

496 篇文章 223 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

原生的torch是float32的，我们可以借鉴模型量化的思想将其变成float16，而且pytorch自身就定义了半精度的tensor

假设我训练的一个模型为model，我们在运算的时候直接将模型转成半精度的模型，怎么做的呢？直接使用model.half()就行

model.half()
model.cuda()

float32的tensor的变量 img，为了使用半精度的模型，同样需要将其输入转成HalfTensor

img=img.type(torch.HalfTensor).cuda()
现在就可以正常使用半精度的模型了：

out = model(img)

注意：img无论在cpu或者gpu上，

img.type(torch.HalfTensor).cuda()

转换类型后，都在cpu上，需要再转到gpu上。

float16转float32：

img.type(torch.FloatTensor).cuda()

我们可以对比一下效果，这里我自己拿了一个模型计算了一下：

完整版模型推理时间：0.03268694877624512秒
半精度模型推理时间：0.018633127212524414秒

原文链接：https://blog.csdn.net/zhou_438/article/details/115971686

关注

8
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
pytorch 半精度，提升pytorch推理性能

原生的torch是float32的，我们可以借鉴模型量化的思想将其变成float16，而且pytorch自身就定义了半精度的tensor假设我训练的一个模型为model，我们在运算的时候直接将模型转成半精度的模型，怎么做的呢？直接使用model.half()就行model.half()model.cuda()假设我们有个float32的tensor的变量 img，为了使用半精度的模型，同样需要将其输入转成HalfTensorimg=img.type(torch.HalfTensor).cud
复制链接

扫一扫

专栏目录

AI算法网奇

CSDN认证博客专家 CSDN认证企业博客

码龄15年

Python领域优质创作者

4970: 原创

780: 周排名

3: 总排名

2786万+: 访问

: 等级

24万+: 积分

7万+: 粉丝

8446: 获赞

3281: 评论

2万+: 收藏

私信

关注

热门文章

分类专栏

最新评论

python 日志封装
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。
查看linux服务器硬盘IO读写负载
晴空一垩: 所以怎么解决呢？ Could not run iotop as some of the requirements are not met: - Linux >= 2.6.20 with - I/O accounting support (CONFIG_TASKSTATS, CONFIG_TASK_DELAY_ACCT, CONFIG_TASK_IO_ACCOUNTING)
np.trapz 生动的解释
172664: 您好，博主，我想问一下，我现在有两个SRVF函数q1,q2，我要计算它们的内积，为什么np.trapz(q1,q2)和np.trapz(q2,q1)结果不一样呢
pycharm格式化不换行
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
pycharm格式化不换行
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录；(3)提升标题与正文的相关性。

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。