GRU的源码笔记

最新推荐文章于 2024-05-19 20:44:28 发布

彩色电暖

最新推荐文章于 2024-05-19 20:44:28 发布

阅读量1.6k

点赞数

分类专栏： LSTM

本文链接：https://blog.csdn.net/eruiwen1624/article/details/89424614

版权

LSTM 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

输出和状态是一样的,前一个状态为state,前一个输出也是state,其宽度都是num_units参数
重置门和更新门分别是r和u
首先输入和前一个输出拼接在一起,然后加权(_gate_kernel)再按列平分(因为r,u都是对状态的加权,所以宽度和状态的宽度一样,都是num_units参数),得到重置门r和更新门u

    gate_inputs = math_ops.matmul(
        array_ops.concat([inputs, state], 1), self._gate_kernel)
    gate_inputs = nn_ops.bias_add(gate_inputs, self._gate_bias)

    value = math_ops.sigmoid(gate_inputs)
    r, u = array_ops.split(value=value, num_or_size_splits=2, axis=1)

然后对state进行重置(遗忘)

r_state = r * state

遗忘之后的状态和输入拼接在一起,加权(_candidate_kernel)得到候选状态candidate,接着激活

    candidate = math_ops.matmul(
        array_ops.concat([inputs, r_state], 1), self._candidate_kernel)
    candidate = nn_ops.bias_add(candidate, self._candidate_bias)

    c = self._activation(candidate)

最后对原状态和候选状态各取一定比例叠加在一起,得到新状态,和新输出

    new_h = u * state + (1 - u) * c
    return new_h, new_h

彩色电暖

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
GRU的源码笔记

输出和状态是一样的,前一个状态为state,前一个输出也是state,其宽度都是num_units参数重置门和更新门分别是r和u首先输入和前一个输出拼接在一起,然后加权(_gate_kernel)再按列平分,得到重置门r和更新门u,r,u对应的节点数一样的,都是num_units参数 gate_inputs = math_ops.matmul( array_ops.co...
复制链接

扫一扫

专栏目录