视频预测论文(GAN)(2)-Generating Videos with Scene Dynamics

Generating Videos with Scene Dynamics

这是MIT大佬的论文,这篇主要讲的视频生成,附带有视频预测,也是用gan网络

先介绍一下 3D卷积神经网络
(http://blog.csdn.net/sinat_24143931/article/details/78892362)

这里一个核心思想是将视频分成了前景(foreground )和后景(backgroud)
用一个mask区分 (这里有点像LSTM的遗忘门机制)
z表示高斯分布
生成器
这里写图片描述

这里写图片描述
0 ≥ m(z) ≥ 1 spatio-temporal mask that selects either the foreground f(z) model or the background model b(z)

判别器
The discriminator needs to be able to solve two problems: firstly, it must be able to classify realistic scenes from synthetically generated scenes, and secondly, it must be able to recognize realistic motion between frames. We chose to design the discriminator to be able to solve both of these tasks with the same model. We use a five-layer spatio-temporal convolutional network with kernels 4 × 4 × 4 so that the hidden layers can learn both visual models and motion models. We design the architecture to be reverse of the foreground stream in the generator, replacing fractionally strided convolutions with strided convolutions (to down-sample instead of up-sample), and replacing the last layer to output a binary classification (real or not).
鉴别器需要能够解决两个问题:首先,它必须能够从合成生成的场景中分类真实场景,其次,它必须能够识别帧之间的逼真运动。 我们选择设计鉴别器以便能够用相同的模型解决这两个任务。 我们使用内核为4×4×4的五层时空卷积网络,以便隐藏层可以学习视觉模型和运动模型。 我们将该体系结构设计为发生器中前景流的逆向结构,用逐步卷积(down-sample,而不是up-sample)代替分步的卷积,并替换最后一层以输出二进制分类(真实与否)。

结果:

  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
音乐转换器是一种能够生成具有长期结构的音乐的技术。传统上,音乐生成模型主要依赖于自回归模型,即根据前面的音符预测下一个音符。这种方法很难捕捉到音乐的长期结构,因为它只关注于当前音符与前面音符的关系。 然而,音乐转换器采用了一种全新的方法。它将音乐的生成问题转化为基于自注意力机制的序列到序列问题。自注意力机制允许模型在生成每个音符时考虑到整个音乐序列的信息,而不仅仅是前面的音符。 此外,音乐转换器还引入了一种基于位置编码和层归一化的技术,来增强模型对音乐序列的表征能力和泛化能力。位置编码在序列中为每个位置分配一个向量,以提供位置信息。而层归一化则可以确保模型的每一层都保持相似的输出分布,从而提高模型的训练稳定性和生成效果。 通过这些创新技术的运用,音乐转换器能够更好地捕捉到音乐的长期结构。它可以生成具有旋律、和声和节奏等多个音乐要素的音乐片段,并且这些片段之间能够形成完整的结构,如引言、主题、发展和回旋等。 总之,音乐转换器是一种利用自注意力机制、位置编码和层归一化等技术生成具有长期结构的音乐的方法。它的创新之处在于能够全局考虑音乐序列的信息,并能够生成具有完整结构的音乐片段。这使得音乐转换器成为一个有潜力的工具,在音乐创作和生成领域有着广阔的应用前景。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值