Tensorflow trick 与 细节

原创 2017年10月15日 22:21:29

前后传播采用不同方式


How Can I Define Only the Gradient for a Tensorflow Subgraph?

Suppose you want group of ops that behave as f(x) in forward mode, but as g(x) in the backward mode. You implement it as

t = g(x)
y = t + tf.stop_gradient(f(x) - t)

在一个bnn的实现中有如下一段:

def round_through(x):
    # g(x) = x back
    # f(x) = round(x) forward
    rounded = K.round(x) 
    return x + K.stop_gradient(rounded - x) 

这里正向传播用的是四舍五入后的x值,而反向传播则保留了小数精度。

停止部分变量的梯度计算


在压缩的retrain步骤中,存在freeze部分变量,retrain另一部分的操作。而在Tensorflow中的tf.stop_gradient函数只能把整个Tensor全部停止计算。
How to stop gradient for some entry of a tensor in tensorflow提供了一个较好的方法:

res_matrix = tf.stop_gradient(mask_h*E) + mask*E

其中maskE对应,决定了梯度是否需要被保留。

def entry_stop_gradients(target, mask):
    mask_h = tf.abs(mask-1)
    return tf.stop_gradient(mask_h * target) + mask * target

Tensor 与 Variable


先看一段程序:

a = tf.Variable([1])
with tf.device("/cpu:0"):
    with tf.Session() as sess:
        sess.run(tf.global_variables_initializer())
        print 'a:',a.eval()
        print 'type of a:',a 
        a = a + 1
        print 'a:',a.eval() 
        print 'type of a:',a
        b = a + 1
        print 'b:',b.eval()
        print 'type of b:',b

这是很简单的加法,结果肯定都知道,分别是1,2,3
但同时又加上了他们的类型,这就不太一样了。

a: [1]
type of a: <tf.Variable 'Variable:0' shape=(1,) dtype=int32_ref>
a: [2]
type of a: Tensor("add:0", shape=(1,), dtype=int32, device=/device:CPU:0)
b: [3]
type of b: Tensor("add_1:0", shape=(1,), dtype=int32, device=/device:CPU:0)

一开始明明定义的是一个tf.Variable,结果一加却变成了Tensor,之后的b也是这样。说明这些操作只是一些计算过程罢了,就像一些菜谱,没有原材料是无法做饭的。这样说的话,经过了计算,原来的变量a的值其实是没有改变的,因为这些操作都不是针对的Variable。像tf.scatter_update这种操作,输入是Variable,才能进行变量的更新。但当你加入这句话,还是不会有作用,因为这个函数返回的是一个Tensor,也是一个“菜谱”,只有当执行时才会生效。

因此Tensorflow的VariableTensor还需要更深的理解啊。

版权声明:本文为博主原创文章,转载请标注出处。

相关文章推荐

NIO trick and trap .pdf

  • 2017年06月20日 14:51
  • 2.05MB
  • 下载

arp_trick.tar.gz

  • 2014年04月04日 18:19
  • 30KB
  • 下载

python 爬虫及multiprocessing包——多线程爬取并解析百度贴吧某贴小trick

preface:看极客学院关于xpath的视频时,偶然看到可以用multiprocessing进行多线程爬取网页,只有小段代码,故先贴出来。mark下。 coding: #!/usr/bin/env...

list_sticky_scroll_trick

  • 2016年01月02日 10:58
  • 78KB
  • 下载

NIO trick and trap NIO网络

  • 2011年07月08日 21:33
  • 3.04MB
  • 下载

稳扎稳打Silverlight(41) - 3.0Tip/Trick之GPU 加速, Out-Of-Browser, 应用程序库缓存, 合并 ResourceDictionary, 应用程序扩展服务,

[索引页] [源码下载] 稳扎稳打Silverlight(41) - 3.0Tip/Trick之GPU 加速, Out-Of-Browser, 应用程序库缓存, 合并 Resource...

poj 3207 Ikki's Story IV - Panda's Trick 2-sat

题意: 在一个圆上有n个点,m条边将他们相连,问是否有一种连发使没有两条线相交。 分析: 每条线要么在圆内,要么在圆外,2-sat问题。 代码: //poj 3207 //sep9 #inc...
  • sepNINE
  • sepNINE
  • 2014年12月08日 13:58
  • 493

【POJ 3207】Ikki's Story IV - Panda's Trick

【POJ 3207】Ikki's Story IV - Panda's Trick 2-SAT判断可行性模板题~

Ikki's Story IV - Panda's Trick poj3207 tarjan+2-SAT

题意/Description:     liympanda, one of Ikki’s friend, likes playing games with Ikki. Today after mine...

poj 3207 Ikki's Story IV - Panda's Trick#2-sat

/** 裸地2-sat问题。关键在于找到其中的矛盾关系。 一个圈上n个点,要连m条边,要求边只能连在圈内或圈外,且边与边不能相交。 把每条边拆成两条,圈内一条,圈外一条, 则两条边的矛盾关...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Tensorflow trick 与 细节
举报原因:
原因补充:

(最多只允许输入30个字)