序列模型（马尔可夫，潜变量）

m0_67708072

已于 2023-03-27 20:12:28 修改

阅读量400

点赞数

分类专栏：跟李沐学AI 文章标签： nlp 深度学习

于 2023-03-27 15:43:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_67708072/article/details/129794523

版权

跟李沐学AI 专栏收录该内容

15 篇文章 2 订阅

订阅专栏

序列数据：有时序结构的数据，当前数据和之前观察到的数据相关。如：音乐，文本，语言都是连续的。

序列数据如何建模呢？首先需要明确我们观察到的数据 $(x_{1},x_{2},...,x_{T})$ 是服从联合分布 $p(\textbf{x}) = p(x_{1},x_{2},...,x_{T})$ 的不独立的随机变量。不像识别图片时，图像数据互相都是相互独立的。我们要做的就是对这个联合分布 $p(\textbf{x})$ 建模，联合概率可以用条件概率展开，有两种方式如下：

方式一：x1->xT

第一种展开方式：要想对 $x_{T}$ 建模，必须知道过去发生什么事情，必须知道 $x_{1},..,x_{T-1}$ 。

方式二：xT->x1

第二种展开方式：反序的，要算 $x_{1}$ ，需要知道 $x_{2},...,x_{T}$ 。这种方式物理上不一定可行，因为真实事件一般都是未来基于前面的事件去产生。

接下来，基于第一种展开方式（用过去预测将来）来讲一下序列模型。核心是对条件概率建模，也就是在过去的数据上建立一个模型，来预测未来。这里过去和未来的数据是一种东西，也就是拿自己的过去预测自己的未来，即自回归模型：

对条件概率建模

那么如何去得到上图中的 $f$ 以及求得待预测的 $x_{t}$ 就是我们关注的重点。

课程中介绍两种自回归模型，1 马尔可夫假设 2 潜变量模型。

马尔可夫假设是假设当前数据只和过去 $\tau$ 个数据点相关，相当于在用过去预测未来时，对使用的过去数据定了个长度，这样做方便了建模，比如使用MLP多层感知机在过去数据上建模。

马尔科夫假设

潜变量模型是使用了一个潜变量 $h_{t}$ 来表示过去的信息，即 $h_{t} = f(x_{1},...,x_{t-1})$ 。把过去的信息用一个数据表示，

潜变量模型

潜变量模型关注两个点：一个是如何构造模型去得到潜变量；一个是如何由潜变量去预测未来。RNN就是潜变量模型。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
序列模型（马尔可夫，潜变量）

序列数据：有时序结构的数据，当前数据和之前观察到的数据相关。如：音乐，文本，语言都是连续的。序列模型：马尔科夫假设；潜变量模型。
复制链接

扫一扫

专栏目录

m0_67708072 CSDN认证博客专家 CSDN认证企业博客

码龄2年

24: 原创

125万+: 周排名

6万+: 总排名

6641: 访问

: 等级

326: 积分

51: 粉丝

74: 获赞

1: 评论

63: 收藏

私信

关注

热门文章

分类专栏

最新评论

关于用None拓展维度
CSDN-Ada助手: 亲爱的作者，恭喜你发布了关于用None拓展维度的博客！你的创作真的很有深度，并且能够为读者带来新的思考。在下一篇博客中，也许你可以尝试结合实际案例，或者分享一些个人的经验和见解，这样可以更好地吸引读者。期待你更多的精彩作品！加油！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。