- 博客(2)
- 资源 (1)
- 收藏
- 关注
翻译 Training With Mixed Precision
Chapter 2. Mixed Precision Training在NVIDIA DeepLearning SDK的cuda8与Pascal架构中已经在训练时引入了低精度的能力。混合精度在计算方法中结合了不同数据精度。半精度(也被称为FP16)对比高精度的FP32与FP64降低了神经网络的显存占用,使得我们可以训练部署更大的网络,并且FP16在数据转换时比FP32或者FP64更节省时间。单精度...
2018-06-11 15:13:27 1747
翻译 TensorRT3.0开发手册 (SamplePlugin:Implementing A Custom Layer)
3.8 SamplePlugin:Implementing A Custom LayerSamplePlugin例程展示了如何在TensorRT中新增一个用户自定义层。例程中实现了如何将MNIST例程中原本直接cuBLAS库实现的最后全卷积层进行替换。注:当前Plugin层只支持FP32精度。3.8.1 Key Concepts本例中解释的关键概念包括:Ø 如何创建一个用户自定义层Ø 如何利用...
2018-06-01 15:50:47 2205 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人