Deep Learning - Theano.scan 对比理解

最新推荐文章于 2019-03-05 16:00:24 发布

李亚超

最新推荐文章于 2019-03-05 16:00:24 发布

阅读量963

点赞数 1

分类专栏： Deep Learning

本文链接：https://blog.csdn.net/Harry_lyc/article/details/53232992

版权

Deep Learning 专栏收录该内容

7 篇文章 1 订阅

订阅专栏

def test_fun(inputs, sa):
    return inputs + sa

sequences = T.arange(15)
print sequences.eval()
init_state = T.as_tensor_variable(numpy.asarray(1, sequences.dtype))
n_steps=15
al, updates = theano.scan(test_fun, sequences=sequences, outputs_info= init_state ,name="test_fun", n_steps=(n_steps))
#sequences = inputs, init_state = sa
print al.eval()

val = []
tmp = 1
for i in sequences.eval():
    tmp += i
    val.append(tmp) 
print val

运行结果为：

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14]
[  1   2   4   7  11  16  22  29  37  46  56  67  79  92 106]
[1, 2, 4, 7, 11, 16, 22, 29, 37, 46, 56, 67, 79, 92, 106]

scan是theano提供的一个循环结构，因为这种函数式的变成方法，导致很难理解内部运行过程。本文把scan与普通的for循环进行对比，方便大家理解这个功能的运行。

sequence是输入数据

init_state是初始化数据

test_fun是将输入数据进行相加，返回结果

上图的两端代码中，i对应着n_steps，tmp对应init_state，val对应着al

即scan一次输入Sequence中的每个数，输入到test_fun中，与init_state进行相加，返回。返回的结果保存在init_state中，作为下一个循环的输入。