Introduction
PixelRNN和PixelCNN都没有做独立性假设。
通过一层256维的softmax层来将像素值当做离散分布来建模。
Math Model
generating an image pixel by pixel
输入图像是n×n个pixels的x,x可以视为一个长为
n2
的序列,序列是由x按行读取形成的。为了评估该序列的联合概率分布
p(x)
,文章将该联合概率表现为
n2
个条件概率的乘积:
而每一个
xi
的值又是由RGB三个通道的值联合决定的。所以将
p(xi|x<i)
改写成以下形式:
这样每一个通道的值既取决于之前的像素值又取决于其他通道的值。
值得注意的是,在训练和评估模型时,像素值分布的计算可以是parallel的,而在实际生成图像时则是sequential的。