tensorflow量化代码实现和实验

最新推荐文章于 2021-04-19 09:35:08 发布

zxbinggo

最新推荐文章于 2021-04-19 09:35:08 发布

阅读量600

点赞数

分类专栏：深度学习文章标签：深度学习 tensorflow

本文链接：https://blog.csdn.net/zc199329/article/details/106013299

版权

深度学习专栏收录该内容

24 篇文章 0 订阅

订阅专栏

tensorflow量化代码实现和实验

tensorflow量化代码

1.构建float graph
按照tensorflow定义网络的方式定义网络结构，例如：

batch_norm_params = {'is_training': is_training, 'center': True, 'scale': True,'epsilon':2e-5}
 with slim.arg_scope([slim.conv2d],
                      padding='SAME',
                      activation_fn=act_type,
                      normalizer_fn=slim.batch_norm,
                      normalizer_params=batch_norm_params,                    weights_regularizer=slim.l2_regularizer(0.00001),  # 0.0005
                      ):
        conv_split1 = slim.conv2d(data_split1, num_outputs=int(filters/group), kernel_size=kernel_size, stride=stride)

2.添加量化节点

for_quant = args.for_quant
if for_quant == 1:
     print("quant train")
     g = tf.get_default_graph()  
     tf.contrib.quantize.create_training_graph(input_graph=g, quant_delay=10)

3.构建训练流程

# step 1:get float graph
m = args.margin_m
x = tf.placeholder(tf.float32, [None, height, width, 1])
y = tf.placeholder(tf.int32, [None, 1])
loss,fc = get_graph(x,y,numclasses,m,True)
#step 2:get varibles for train
for_quant = args.for_quant
if for_quant == 1:
   g = tf.get_default_graph()
   tf.contrib.quantize.create_training_graph(input_graph=g, quant_delay=10)
#step 3:get dataIter
filenames = tf.placeholder(tf.string, shape=[None])
dataset = tf.data.TFRecordDataset(filenames)
dataset = dataset.map(parser_tfrec, num_parallel_calls=4)  #
dataset = dataset.shuffle(buffer_size=batch_size * 1000)
dataset = dataset.batch(batch_size)
dataset = dataset.repeat(epochs)
dataset = dataset.prefetch(buffer_size=batch_size * 10)#
# step 4:initial and optimizer
iterator = dataset.make_initializable_iterator()  #
images, labels = iterator.get_next()
global_step = tf.Variable(0, trainable=False)
with tf.control_dependencies(update_ops):
        optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.01).minimize(loss,global_step=global_step)
init_op = tf.global_variables_initializer()
    sess.run(init_op)
#step 5:train
for epoch in range(epochs):
        avg_loss = 0
        sess.run(iterator.initializer, feed_dict={filenames: [rec_file]})
        for i in range(total_batch):
             image, label = sess.run([images, labels])
              _, c= sess.run([optimizer, loss],feed_dict={x: image, y: label})  # , m: mValue

#step 6:save
saver.save(sess, saveFileName, global_step=epoch)

4.注意事项

注意使用BN参与量化，无BN量化会失败
用了BN不需要bias，加了也没有，因为默认conv+bn合并
注意参数定义，初始化和saver的声明顺序，有很多时候的运行出错都是因为这个。
注意定义graph的时候加上scope，这样可以防止参数命名重合，之后查找也方便。

实验结果

tensorflow的训练量化，显存会比浮点训练大2-3倍，速度下降至4倍，显卡利用率低。
量化的结果通常比训练后量化效果好一些，需要调一些参数。比如quant_delay的设置，lr的设置等等。这个后续会继续做实验研究。

后续

后续会研究一下原理。

zxbinggo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
tensorflow量化代码实现和实验

tensorflow量化代码实现和实验tensorflow量化代码1.构建float graph按照tensorflow定义网络的方式定义网络结构，例如：batch_norm_params = {'is_training': is_training, 'center': True, 'scale': True,'epsilon':2e-5} with slim.arg_scope([slim.conv2d], padding='SAME',
复制链接

扫一扫

专栏目录