LAVE :
LLM
驱动的视频编辑代理辅助和语言增强功能
视频创作已变得越来越流行,但编辑所需的专业知识和精力往往会给初学者造成障碍。在本文中,我们探讨了如何将大语言模型(LLM)整合到视频编辑工作流程中,以减少这些障碍。我们的设计愿景体现在 LAVE 中,这是一个新颖的系统,可提供由 LLM 驱动的代理协助和语言增强编辑功能。LAVE 可自动生成用户镜头的语言描述,为 LLM 处理视频和协助编辑任务奠定基础。当用户提供编辑目标时,代理会计划并执行相关操作来实现这些目标。此外,LAVE 还允许用户通过代理或直接用户界面操作来编辑视频,从而提供了灵活性,并可手动改进代理操作。我们的用户研究包括从新手到精通编辑的八名参与者,研究结果证明了 LAVE 的有效性。研究结果还揭示了用户对拟议的 LLM 辅助编辑范例的看法及其对用户创造力和共同创造感的影响。基于这些发现,我们提出了设计方面的启示,为代理辅助内容编辑的未来发展提供参考。
参考文献:
《LAVE:LLM_Powered Agent Assistance and Lange Augmentation for Video Editing 》
网址:
https://arxiv.org/pdf/2402.10294.pdf