大家好我是二狗。
就在今天,据推特大V“小互”分享,Sora的完整能力曝光,根据OpenAI 申请的SORA™商标注册描述显示:
除了众所周知文生图和文生视频之外,Sora还具备多模态图像视频理解能力—— 对视频和图像进行识别、处理、分析、理解。
下面是SORA™商标注册描述截图:
OpenAI 总是处处抢先一步
Sora 模型文生视频的强大,大家都见识到了。
下面是 Sora 模型生成的鲜花老虎漫天飞舞的视频。
而这次 Sora 模型暴露出来的多模态图像视频理解能力就很值得人玩味。
毕竟此前几天,Sora 模型正是在谷歌发布拥有多模态视频理解能力的Gemini 1.5之后几个小时才发布的。
Sora 模型的多模态视频理解或成为下次爆点。
同时这正是 OpenAI 的宣发理念——气死对手,永远占领用户心智。
前几日,据昆仑万维创始人周亚辉剧透,OpenAI将很快发布GPT4.5,而且估计会故意选择 Anthropic 发布Claude 3的时候发布。
Sora模型离不开中国??
就在OpenAI发布Sora 模型改变世界的时候。
在国内,竟然有报道称Sora关键原材料之一来自于一家绵阳公司:
网友们纷纷开启了吐槽模式: