Lecture15-Efficient Training

继上个Lecture15

目录

  • 并行
  • FP16和FP32的混合精度
  • 模型蒸馏
  • DSD:密集-稀疏-密集训练
    在这里插入图片描述

1 并行计算

  • 数据并行
  • 模型并行
  • 超参并行

1.1数据并行

例子1:两张图同时被输入同一个网络中,同时计算,这几乎不影响时延。
在这里插入图片描述
实现方式:Parameter Server进行统一管理,每一个数据的权重更新被独立管理,例如分给不同的处理器或线程。
在这里插入图片描述
例子2:卷积层的输入被切分,并行处理,例如一张图片切4份。
例3:完全连接层切成几份,交给不同的处理器or线程。
例4:超参并行,例如学习率和weight dacay分开。
等等……
总结
在这里插入图片描述

1.2 FP16和FP32

思想:部分使用低精度FP16。FP16比FP32省4倍的时间和容量。
Q:哪里部分使用FP16?哪里使用FP32?
在这里插入图片描述
在这里插入图片描述

1.3 模型蒸馏

思想:用多个训练好的复杂网络去训练一个结构更加简单地小网络。
步骤:使用软输出训练
软输出:输出向量中的值之间差距更小,但依然可以识别正确。
效果:使用软输出训练,可以使用少量的训练样本就达到相仿的精度。
在这里插入图片描述
软化方法:T决定软化的程度。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值