Neural Translation Model 给定源语言 string s , 通过网络模型来估计目标语言string t 的概率分布 p(t|s) 。 与PixelCNN类似, t 的联合概率分布可以通过链式法则转化为连续的 p(ti|t