Language2Pose: Natural Language Grounded Pose Forecasting # 论文阅读

最新推荐文章于 2024-09-17 22:35:40 发布

奔跑的汉堡包

最新推荐文章于 2024-09-17 22:35:40 发布

阅读量327

点赞数 10

文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29679623/article/details/138637978

版权

URL

https://arxiv.org/pdf/1907.01108

TD;DR

19 年 7 月 cmu 的文章，提出一种基于 natural language 生成 3D 动作序列的方法。通过一个简单的 CNN 模型应该就可以实现

Model & Method

首先定义一下任务：

输入：用户的自然语言，应该是通过词袋模型转换成 word vector
输出：shape = [t, j, 3] 的 tensor，t 表示时间维度，j 表示身体的关节点个数，3 表示 3d 关键点的维度。
训练过程是这样的：用两个 encoder 分别把 pose 和自然语言模型转换到 latent space，然后在 latent space 层面尝试完全对齐两者，这样就可以把对齐后的 latent 经过 pose decoder 还原到 pose 域内。

在这里插入图片描述

Dataset & Results

使用的训练数据集是一个开源的。

在这里插入图片描述

看起来训练时候文本的分布多样性还是可以的

在这里插入图片描述

Thought

思路有点像 GAN
时间比较老了，但是值得参考，可以用来快速复现 + 攒一个 ppl

奔跑的汉堡包

关注

10
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

奔跑的汉堡包 CSDN认证博客专家 CSDN认证企业博客

码龄9年

38: 原创

39万+: 周排名

3万+: 总排名

6万+: 访问

: 等级

1192: 积分

204: 粉丝

308: 获赞

145: 评论

450: 收藏

私信

关注

热门文章

分类专栏

读书笔记 2篇

最新评论

Multi-Concept Customization of Text-to-Image Diffusion # 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Multi-Concept Customization of Text-to-Image Diffusion # 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Training-Free Consistent Text-to-Image Generation # 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
DiT：Scalable Diffusion Models with Transformers # 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Mix-of-Show: Decentralized Low-Rank Adaptation forMulti-Concept Customization # 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。