序列模型(马尔可夫,潜变量)

        序列数据:有时序结构的数据,当前数据和之前观察到的数据相关。如:音乐,文本,语言都是连续的。

        序列数据如何建模呢?首先需要明确我们观察到的数据 (x_{1},x_{2},...,x_{T}) 是服从联合分布p(\textbf{x}) = p(x_{1},x_{2},...,x_{T})的不独立的随机变量。不像识别图片时,图像数据互相都是相互独立的。我们要做的就是对这个联合分布 p(\textbf{x}) 建模,联合概率可以用条件概率展开,有两种方式如下:

方式一:x1->xT

 第一种展开方式:要想对 x_{T} 建模,必须知道过去发生什么事情,必须知道x_{1},..,x_{T-1}

方式二:xT->x1

第二种展开方式:反序的,要算x_{1},需要知道 x_{2},...,x_{T}。这种方式物理上不一定可行,因为真实事件一般都是未来基于前面的事件去产生。

        接下来,基于第一种展开方式(用过去预测将来)来讲一下序列模型。核心是对条件概率建模,也就是在过去的数据上建立一个模型,来预测未来。这里过去和未来的数据是一种东西,也就是拿自己的过去预测自己的未来,即自回归模型:

对条件概率建模

 那么如何去得到上图中的 f 以及求得待预测的x_{t} 就是我们关注的重点。

        课程中介绍两种自回归模型,1 马尔可夫假设 2 潜变量模型。

        马尔可夫假设是假设当前数据只和过去\tau个数据点相关,相当于在用过去预测未来时,对使用的过去数据定了个长度,这样做方便了建模,比如使用MLP多层感知机在过去数据上建模。

马尔科夫假设

        潜变量模型是使用了一个潜变量 h_{t} 来表示过去的信息,即 h_{t} = f(x_{1},...,x_{t-1}) 。把过去的信息用一个数据表示,

潜变量模型

潜变量模型关注两个点:一个是如何构造模型去得到潜变量;一个是如何由潜变量去预测未来。RNN就是潜变量模型。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值