Sora文生视频
2024年2月,OpenAI在ChatGPT的基础上推出了文字生成视频大模型Sora(text-to-video model),又是一项革命性的技术突破。观看Sora生成的视频,其逼真程度令人惊叹,仿佛实际拍摄的作品,展现了其强大的潜力和无限的可能性。
例如下面这个Sora生成的视频,根据以下提示文本生成:在东京的一条街道上,一位时髦的女士自信而随意地走着。这条街道被温暖的霓虹灯和生动的城市标志照亮。她穿着一件黑色皮夹克,一条长长的红裙子,黑色靴子,还提着一个黑色包包。她戴着太阳镜,涂着红唇膏。街道潮湿且反光,形成了一种色彩斑斓的灯光镜像效果。许多行人来来往往。
原文:Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
Sora:A stylish woman
Sora的目标:世界模拟器(world simulators)和通用人工智能AGI(artificial general intelligence)
Sora的目标不仅局限于文字生成视频,它要成为世界模拟器(world simulators)。ChatGPT通过阅读人类文字,完成了理解人类语言的历史里程碑;而Sora不仅理解人类的语言和文字,还要通过人类视频深入探索和理解物理世界的运动规律、自然现象等复杂系统,然后模拟出一个虚拟世界。最终成为通用人工智能AGI(artificial general intelligence)
Sora的出现让我想起了科幻电影《黑客帝国》中的Matrix概念。Matrix通过学习和理解人类的知识和物理定律,创造了一个虚拟的世界,让人类的思维在其中生活。虽然Sora目前还处于初级阶段,有时生成的视频会出现违反物理规律的情况,但这正是类似于《黑客帝国》中虚拟世界的不稳定现象。
例如 漂浮的椅子
这不禁让我深感震撼:人工智能的发展速度竟然如此迅猛!从ChatGPT到Sora,人工智能正逐步从理解语言走向模拟世界。这一切都提醒我们,必须认真思考和探讨人工智能的未来发展,以确保其能够造福人类,而不是成为潜在的威胁。
参考: