L2 Autoregressive Model

lzk_nus

已于 2023-02-05 09:30:04 修改

阅读量655

点赞数 1

分类专栏： Machine Learning Deep Learning 文章标签：深度学习人工智能

于 2023-01-02 10:41:58 首次发布

本文链接：https://blog.csdn.net/qq_42791848/article/details/128518790

版权

本文介绍了自回归模型在机器学习中的应用，包括最大似然估计、RNN、基于掩码的模型如MADE和PixelCNN。这些模型用于概率分布的学习和高维数据生成，讨论了它们的优缺点以及在图像和音频领域的应用。WaveNet和PixelCNN通过特殊的卷积结构增强了模型的表达能力和感受野。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Lecture2 Autoregressive Models

Lecture2的主要内容是自回归模型，主要包括：

Motivation
Histogram
Neural Autoregressive models
- Parameterized distributions and maximum likelihood
- Autoregressive models
  - RNN
  - Masking-based models

基于似然的模型主要做的一件事情是：根据数据集 $\{x^{(1)},\dots,x^{(n)}\}$ 学习一个概率分布 $p_{data}$ 。学习到的 $p_{data}$ 应该满足：

但是我们所处理的数据通常都是高维的，例如一张 $128\times128\times3$ 的彩色图像，他的维度大约是 $50000$ 。因此我们还希望我们的模型具有以下几个特点：

最简单粗暴的方法就是根据训练集画一个直方图，我们只需要知道每个特征有哪些不同的取值然后计算frequency当作probability即可

根据直方图模型，我们可以轻松的进行以下两个操作：

Inference：给定一个 $x$ ，求 $p (x)$ 。可以直接看图说话
Sampling：根据CDF生成 $x$ 。可以通过以下几步完成
1. 首先计算出CDF： $F_{i}\ =\ \sum_{j=1}^{i}p(j)\ \ \ \ \ i\in \{1\dots k\}$ ， $k$ 是特征不同取值的数量
2. 随机生成一个 $0$ 到 $1$ 之间的数 $u$
3. 返回最小的 $i$ 满足 $F_i \ge u$