神经网络加速指南

分析各步骤耗时

1、CPU上的操作耗时:

        尝试将操作放在GPU上进行,如np.argmax的操作

2、.cpu()耗时

        尝试减少传输tensor的大小

3、数据预处理耗时

        1)resample操作尝试放到GPU上处理?

        2)先crop后resample?

4、调用不同的包耗时不同

        如scipy / skimage / sklearn / numpy

5、网络运行耗时

        1)inference时可以不对网络权重进行初始化操作

        2)选用不同的网络框架

        3)减少channel数

        4)减少层数

6、其他

        1)torch.backends.cudnn.benchmark

        2).half() 操作可以减少显存占用,但在V100等高端机器上优化做的很好,普通机器上速度奇慢

        3)训练时不建议使用torch.cuda.empty_cache(),会减慢训练速度

       

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值