为了这个视频模型,英伟达每天正在疯狂地爬取相当于 80 年时长的视频数据。
今天,一则关于英伟达要下场做视频模型的消息引爆了 Reddit。
消息源出自外媒 404 Media,据它获得的 Slack 聊天(英伟达的内部聊天平台)、电子邮件和文件显示,英伟达正在从 Youtube 和其他几个来源抓取视频,收集用于其 AI 产品的训练数据。
404 Media 查看的英伟达内部对话显示,当参与该项目的员工提出有关使用「禁止商用的研究数据集」和「YouTube 视频」可能产生法律问题时,管理人员告诉他们,他们已获得公司最高层的批准,可以使用这些内容。
一位匿名的前英伟达员工对此表示,员工被要求从 Netflix、YouTube 和其他来源抓取视频,以训练的 Omniverse 3D 世界生成器、自动驾驶汽车系统和「数字人」产品的 AI 模型。
该项目内部命名为 Cosmos(但与公司现有的 Cosmos 深度学习产品不同),尚未向公众发布。该项目领导层发给员工的电子邮件显示,Cosmos 的目标是构建一个最先进的视频基础模型,「将光传输、物理和智能模拟封装在一个地方,以解锁对英伟达至关重要的各种下游应用。」
为了收集训练视频,英伟达员工使用名为「 yt-dlp」的开源 YouTube 视频下载器。他们试图从 Netflix 等各种来源下载完整视频,但主要集中在 YouTube 视频。404 Me