Ternary weight networks

本文介绍了Ternary Weight Networks (TWNs),一种将权重限制在1, 0, -1的网络结构,以2-bit存储权重。TWNs在保持与全精度网络接近性能的同时,提供了更高的表达能力和显著的模型压缩,可压缩16到32倍,减少乘法运算。通过阈值函数逼近全精度权重,实现计算效率与硬件友好。实验表明,TWNs在表达能力、模型压缩和计算需求上优于二进制精度网络。" 120993575,10634274,使用DOSBox与MASM进行微机原理汇编语言实验,"['编辑器', 'DOSBox', '汇编语言', '程序编译', '调试工具']
摘要由CSDN通过智能技术生成

这篇文章开发了一种新型的网络结构——ternary nearal networks(TWNs)。该网络所有的权值被限制在1,0,-1之中,只需要2-bit来存储权值信息。TWNs和全精度的网络之间的欧氏距离确保是最小的,为了高效地实现这一点,文章中使用了一个threshold-based function来近似。

在性能方面,TWNs比起binary precision有更强大的描述性;同时和全精度的网络相比,能够压缩16~32倍,而且乘法的开销也会变小。具体的优势如下:

Expression ability

现在大型的CNN网络如VGG个、GooLeNet等都采用的是3*3的filter,所以和binary precision的2^9=512种不同的表示相比,ternary precision有3^9=19683种不同的表示。

Model compression

TWNs需要2-bit来存储权值信息,比起float和double类型的precision能够压缩16~32倍,但是模型的规模是binary precision的2倍左右。比如VGG网络原本需要大约500M的存储空间,经过压缩之后只需要大约32M的存储空间。

Computational requirement

和BPWNs相比,TWNs有额外的0,但是这并不影响乘法操作中的累加,所以性能并不会比BPWNs差,对硬件也是友好的。

1 Problem formulation

作者试图使得ternary value和full precision value之间的欧氏距离最短。假设fp的权值为W,ternary-value的权值为Wt,再加上一个非负的缩放系数α,这个优化问题可以表述为:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值