提高5倍的训练速度通常使用GPU完成深度学习
why need GPU?caffe speed with GPU,主要为了cuda库来完成线程和进程之间协调分配。调参数后的网络使用建议,计算速度快的主要原因是alexnet在2012年,多节点和多GPU的使用共同训练,做推理时design choices,采用分布式算法带来节点计算提升。
怎样用深度学习使用做Web应用:
caffe工具做的web service,
首先我们需要linux下安装包完成驱动cuda和cudnn库使用注册
库依赖的编译麻烦问题可以用dockerfile解决这些问题使用api get,
一般用Nvidia的官方的caffe这样便于加速,伯里克管网demos基于python开发
DIGITS-deep learning training visualization使用和训练误差性能分析支持大部分框架
GIE 专门做模型部署的infernce deployment,训练比较耗散进度,通过8位计算精度,对中间参数值TensorRT做简直工作
做inference计算p4专门。
Deep stream SDK:视频的高速识别分类(需要申请试用)视频解码的流直接进行分类,不需要输入和输出,现在只支持caffe的网络模型。
NCCL,启用NCCL多卡交互。
集群管理和调度使用深度学习的系统架构使用marathon管理计算资源的选址和深度学习计算。
参加使用Super Vessels使用,选用GPU。
目前最大困难深度学习的性能分析理论。/进程隔离是困难保证GPU限制显存。深度学习占用资源一般是固定的,