原文链接
https://arxiv.org/abs/1705.01462
摘要
提出一种三值化方法,激活函数是8/4bit的,不需要训练,对N个权重量化到三值 ,N=2,4,8,16等等。当N=4时,ResNet-101和ResNet-50的Top1准确率分别下降3.7%和4.2%。
方法
目的:不训练地,把32bit浮点权重 W W 量化为
。
基于阈值
https://arxiv.org/abs/1705.01462
提出一种三值化方法,激活函数是8/4bit的,不需要训练,对N个权重量化到三值 ,N=2,4,8,16等等。当N=4时,ResNet-101和ResNet-50的Top1准确率分别下降3.7%和4.2%。
目的:不训练地,把32bit浮点权重 W W 量化为
。
基于阈值