序列模型笔记

最新推荐文章于 2023-02-26 21:28:08 发布

Better-1

最新推荐文章于 2023-02-26 21:28:08 发布

阅读量159

点赞数

分类专栏：深度学习项目

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caihuanqia/article/details/106438879

版权

深度学习项目专栏收录该内容

15 篇文章 1 订阅

订阅专栏

EOS标记可以添加到训练集每一个句子的结尾。
计算机对于自然语言的理解只能通过把文本转化为向量、矩阵的形式，通过计算来获取有用的信息，词嵌入应运而生。
词嵌入（WordEmbedding）的目的在于把某个词语、短语映射到高维空间，让相同、相近含义的字词在空间距离上距离相近

RNN的每一个神经元的softmax的输出就是词典的大小，每个词都有对应的概率。
下面是RNN从左到右依次预测每个词的过程。
在这里插入图片描述
上图是第一个神经元，然后再把第一个预测到的概率最大的输入到下一个神经元。

在这里插入图片描述

损失函数：每个时间步:
在这里插入图片描述
总的损失函数就是把所有时间步的损失都加起来。

采样使用的是随机采样：np.random.sampling
原因：如果是直接采用的softmax最大概率的预测，那么生成模型显然不具备结果多样性的特点。
注意，由于一些不是频繁出现的字符自定义置为某些字符比如都是 UNK，所以如果采样都UNK，可以继续采样来替换。

可以使用字符级的语言模型预测，即就是字母，数字，空格等符号组成原本的文本，这样就不会有新的未知短语的出现。但是需要更多的算力！！没有广泛的应用。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。