序列数据
- 实际中很多数据是有时序结构的
- 电影的评价随时间变化而变化
- 拿奖后评分上升,直到奖项被忘记
- 看了很多好电影后,人们的期望变高
- 季节性:贺岁片、暑期档
- 导演、演员的负面报道导致评分变低
- 音乐、语言、文本、和视频都是连续的
统计工具
- 在时间 t t t观察到 x t x_t xt,那么得到 T T T个不独立的随机变量 ( x 1 , . x T ) ∼ p ( X ) (x_1,.x_T)\sim p(X) (x1,.xT)∼p(X)
- 使用条件概率展开 p ( a , b ) = p ( a ) p ( b ∣ a ) = p ( b ) p ( a ∣ b ) p(a,b)=p(a)p(b|a)=p(b)p(a|b) p(a,b)=p(a)p(b∣a)=p(b)p(a∣b)
自回归模型 - 对条件概率建模
p ( x t ∣ x 1 , . . . , x t − 1 ) = p ( x t ∣ f ( x 1 , . . . , x t − 1 ) ) p(x_t|x_1,...,x_{t-1})=p(x_t|f(x_1,...,x_{t-1})) p(x