活动报名:斯坦福&谷歌,视频生成框架WonderJourney,吴佳俊学生俞洪兴分享

9b21af07008cfa4a5b194daedc0ce478.png

报告主题:WonderJourney,创造属于你的开放式三维世界

报告日期:12月28日(周四)11:00-12:00

31e1cc3dde2c4cb7c328dd58e76ed448.jpeg

主题简介:

你是否也曾好奇《爱丽丝梦游仙境》中的种种奇幻经历,但却难以仅从文字或插图中想象?在这次演讲中,我将介绍我们近期的工作,“WonderJourney”。从一张图片或一段文字出发,WonderJourney能合成一系列多样且自然连接的3D场景,让用户能够看到一个独特的“Wonderland”。WonderJourney是一个用于持续生成3D场景(Perpetual 3D scene generation)的模块化框架。与之前专注于单一场景类型的视角生成工作不同,我们从任何用户提供的位置(通过文本描述或图片)出发,生成一条穿越一系列多样但又连贯相接的3D场景的旅程。我们利用一个大型语言模型(LLM)来生成这次旅程中场景的文本描述,一个基于文本驱动的点云生成流程来创造引人入胜且连贯的3D场景序列,以及一个大型的视觉语言模型(VLM)来验证生成的场景。我们展示了各种场景类型和风格上引人注目、多样化的视觉结果,形成了想象中的“奇幻旅程“(”wonderjourney”)。

结果可以在项目网站上浏览:https://kovenyu.com/wonderjourney/

Have you ever wonder what Alice saw in her adventure in the Wonderland, but struggled to imagine it solely through the text or illustrations? In this talk, I will introduce “WonderJourney: Going from Anywhere to Everywhere”. From a single image or text, WonderJourney synthesizes a long series of diverse yet naturally connected 3D scenes, giving the user a unique experience of seeing a “wonderland”. WonderJourney is a modularized framework for perpetual 3D scene generation. Unlike prior work on view generation that focuses on a single type of scenes, we start at any user-provided location (by a text description or an image), and generate a journey through a long sequence of diverse yet coherently connected 3D scenes. We leverage an LLM to generate textual descriptions of the scenes in this journey, a text-driven point cloud generation pipeline to make a compelling and coherent sequence of 3D scenes, and a large VLM to verify the generated scenes. We show compelling, diverse visual results across various scene types and styles, forming imaginary “wonderjourneys”. See our results at: https://kovenyu.com/wonderjourney/

报告嘉宾:

俞洪兴(Hong-Xing “Koven” Yu),斯坦福大学四年级博士生,导师为吴佳俊教授。他的研究兴趣为机器感知,主要包括物理场景理解(physical scene understanding),动态模型(dynamics models),以及视觉生成模型(visual generative models)。他曾多次获得中国国家奖学金,斯坦福大学 SoE 奖学金,Qualcomm 奖学金,两次获得 Nvidia 奖学金提名,Meta 奖学金提名,以及 SIGGRAPH Asia 最佳论文奖。

关注俞洪兴:https://kovenyu.com/

扫描下方二维码

22b5b9a795e5439cd55c3990df731269.jpeg

或点击「阅读原文」报名

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值