自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 CUDA基本概念

CUDA线程结构的三个重要概念:Grid,Block,Thread,三者关系如图:Block和Thread的结构可以是一维,二维或者三维,以下Block,Thread结构分别是二维和三维。下表是不同计算能力的GPU的技术指标:每个thread有一份register和local memory空间;同一block共享一份share memory;同一grid的所

2018-01-10 11:00:41 211

原创 深度网络推理加速(Learning both Weights and Connections for Efficient Neural Networks)

摘要针对卷积神经网络的结构在训练之前就已经被固定下来,因而训练过程无法优化网络结构,本文提出了一种三步法在保留网络能力的前提下进行剪枝。首先,让网络在训练中学习到哪些连接是重要的;其次,对不重要的连接进行剪枝;最后,在剪枝后的网路欧上进行微调。用该方法对ImageNet数据的AlexNet和VGG-16网络进行优化,分别将模型减小了十倍左右,而没有损失精度。下图是在45nm工艺的CMOS芯

2018-01-09 14:11:04 649

原创 深度网络推理加速(Towards Lightweight Convolutional Neural Networks for Object Detection)

摘要:本文研究目标是少类别实时目标检测,研究了在保留较高检测率的前提下最大程度的减小模型大小,最终实现了在CPU上的实时检测。本文的推理加速机制和量化压缩等方法是可以并行的。1,  通过增大feature map的尺寸,减小通道数可以得到准确率且快的检测模型,这么做的依据是对于实际的很少类别的目标检测问题,用于解决多类别分类问题的网络中很多通道是冗余的。2,  通过在大的预训练模型上简单的

2018-01-09 13:56:31 2517

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除