论文阅读(三):Text2Sign: Towards Sign Language Production using Neural Machine Translation and GAN-2

Abstract

我们提出了一种新的方法来自动手语生产使用最先进的神经机器翻译(NMT)和图像生成技术。我们的系统能够从口语句子中生成手语视频。与当前依赖于大量注释数据的方法相反,我们的方法需要最少的注释和框架级别的注释来进行培训。我们通过将任务分解为专门的子流程来实现这一点
我们首先利用编译码器网络将口语句子翻译成符号注释序列。然后找到注释和骨骼序列之间的数据映射。我们使用生成的姿态信息来调节生成模型,生成手语视频序列。

Related work

Conditional Image Generation:

semantic labels ->images use CNN [4]
image tags/feature embeddings ->images use PixelCNN,conditioned on a vector[28]
RNN
they all relay on rich semantic and spatially information

1.GAN
conditional GAN
DCGAN conditional GAN+constraints architecture (e.g 带步长卷积替换确定性空间池化)
the extending of DCGAN positional information+text description

2.VAEs
conditonal VAE

3.conbining GANs and VAEs
4. pose conditioned image generation:
input a image of people in arbitrar

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值