RNN cell的实现

最新推荐文章于 2024-07-29 09:04:29 发布

西笑生

最新推荐文章于 2024-07-29 09:04:29 发布

阅读量1.1k

点赞数

分类专栏：深度学习文章标签： RNN

本文链接：https://blog.csdn.net/flyfish1986/article/details/79678239

版权

深度学习专栏收录该内容

149 篇文章 29 订阅

订阅专栏

RNN cell的实现

flyfish

已编译通过
步骤
1 使用tanh激活函数计算隐藏状态
$a^{\langle t \rangle} = \tanh(W_{aa} a^{\langle t-1 \rangle} + W_{ax} x^{\langle t \rangle} + b_a)$

2 使用新的隐藏状态 $a^{\langle t \rangle}$ 计算预测值，
$\hat{y}^{\langle t \rangle} = softmax(W_{ya} a^{\langle t \rangle} + b_y)$
已提供softmax函数

3 在cache中存储 $(a^{\langle t \rangle}, a^{\langle t-1 \rangle}, x^{\langle t \rangle}, parameters)$
4 返回 $a^{\langle t \rangle},y^{\langle t \rangle},cache$

import numpy as np

def softmax(x):
    e_x = np.exp(x - np.max(x))
    return e_x / e_x.sum(axis=0)

def rnn_cell_forward(xt, a_prev, parameters):

    # Retrieve parameters from "parameters"
    #字符串与值的一种映射方法
    Wax = parameters["Wax"]
    Waa = parameters["Waa"]
    Wya = parameters["Wya"]
    ba = parameters["ba"]
    by = parameters["by"]

    #按照上面的公式写就行
    # compute next activation state using the formula given above np.tanh
    #使用上面的np.tanh公式计算下一个激活状态
    a_next = np.tanh(np.dot(Wax, xt) + np.dot(Waa, a_prev) + ba)
    yt_pred = softmax(np.dot(Wya, a_next) + by)


    # store values you need for backward propagation in cache
    #cache在反向传播中会使用
    cache = (a_next, a_prev, xt, parameters)

    return a_next, yt_pred, cache


np.random.seed(1)
xt = np.random.randn(3,10)
a_prev = np.random.randn(5,10)
Waa = np.random.randn(5,5)
Wax = np.random.randn(5,3)
Wya = np.random.randn(2,5)
ba = np.random.randn(5,1)
by = np.random.randn(2,1)
parameters = {"Waa": Waa, "Wax": Wax, "Wya": Wya, "ba": ba, "by": by}

a_next, yt_pred, cache = rnn_cell_forward(xt, a_prev, parameters)
print("a_next = ", a_next)
print("a_next.shape = ", a_next.shape)
print("yt_pred[1] =", yt_pred[1])
print("yt_pred.shape = ", yt_pred.shape)