循环神经网络

最新推荐文章于 2024-02-19 23:45:40 发布

不如狐说

最新推荐文章于 2024-02-19 23:45:40 发布

阅读量652

点赞数

分类专栏： BoYu打卡

本文链接：https://blog.csdn.net/weixin_44934851/article/details/104373617

版权

循环神经网络（RNN）设计用于处理时序信息，通过隐藏状态存储历史信息。常见应用包括语言模型、文本分类、机器翻译等。语言模型如n元语法，简化序列数据的计算。RNN通过隐藏状态在不同时间步长捕获历史信息，形成循环计算。

摘要由CSDN通过智能技术生成

循环神经网络特点：为更好地处理时序信息而设计的。它引⼊状态变量来存储过去的信息，并⽤其与当前的输⼊共同决定当前的输出。

循环神经⽹络常⽤于处理序列数据，如⼀段⽂字或声⾳、购物或观影的顺序，甚⾄是图像中的⼀⾏或⼀列像素。因此，循环神经⽹络有着极为⼴泛的实际应⽤，如语⾔模型、⽂本分类、机器翻译、语⾳识别、图像分析、⼿写识别和推荐系统。

以上是书中得描述，重点，处理序列数据。

语⾔模型

$度为T的词的序列W_1W_2,. . . ,W_T$

语⾔模型的计算

假设序列 $W_1W_2,. . . ,W_T$ 中的每个词是依次⽣成的，我
们有 $P(w_1w_2,. . . ,w_T) = \prod\limits_{i=1}^TP(w_t | w_1, . . . , w_{t−1})$

n元语法

当序列⻓度增加时，计算和存储多个词共同出现的概率的复杂度会呈指数级增加。n元语法通过⻢尔可夫假设（虽然并不⼀定成⽴）简化了语⾔模型的计算。这⾥的⻢尔可夫假设是指⼀个词的出现只与前⾯n个词相关，即n阶⻢尔可夫链（Markov chain of order n）。如果n = 1，那么有P(w3 | w1, w2) = P(w3 | w2)。如果基于n − 1阶⻢尔可夫链，我们可以将语⾔模型改写为
$P(w_1w_2,. . . ,w_T) \approx \prod\limits_{i=1}^TP(w_t | w_{t-(n-1)}w_{t-(n-2)} . . . , w_{t−1})$

最低0.47元/天解锁文章

不如狐说

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
循环神经网络

循环神经网络特点：为更好地处理时序信息而设计的。它引⼊状态变量来存储过去的信息，并⽤其与当前的输⼊共同决定当前的输出。循环神经⽹络常⽤于处理序列数据，如⼀段⽂字或声⾳、购物或观影的顺序，甚⾄是图像中的⼀⾏或⼀列像素。因此，循环神经⽹络有着极为⼴泛的实际应⽤，如语⾔模型、⽂本分类、机器翻译、语⾳识别、图像分析、⼿写识别和推荐系统。以上是书中得描述，重点，处理序列数据。语⾔模型⻓度为T的词的序...
复制链接

扫一扫