OpenAI 表示 AI 五个级别目前公司已接近第二级;马斯克:未来机器人的数量将远远超过人类 | AI头条...

整理 | 王轶群,王启隆

出品 | AI 科技大本营(ID:rgznai100)

1dbe76c1500db1a30d7aae659a01ed4c.png

一分钟速览新闻点!

  • OpenAI 创建了五个级别来显示其在 AI 方面的进展,目前已接近第二级

  • 谷歌使用 Gemini AI 训练其机器人进行导航并完成任务

  • 谷歌发布开源视觉语言模型 PaliGemma 论文

  • 凯茜·伍德再谈英伟达:短期内将面临挑战

  • AI 模型可为癌症患者选择最佳疗法,DeepPT 登上 Nature

  • 上海交大机器人专家王贺升加入 UniX AI,担任首席科学家

  • 全新的 Transformer 加速技术 FlashAttention-3 发布

  • Firecrawl 推出创新工具 SmartCrawl:将网站转化为 API

  • 软银收购英国人工智能芯片制造商 Graphcore

  • IDC:Vision Pro 今年销量预计不会超过 50 万台

  • 法国 Bioptimus 发布疾病诊断人工智能模型

  • Fireworks AI 获 5200 万美元融资,估值达 5.52 亿美元

  • 为智能城市提供视觉 AI 解决方案的 Hayden AI 完成 9000 万美元 C 轮融资

  • 无人驾驶算账,每天成本 471 元

  • 特斯拉推迟无人驾驶出租车 Robotaxi 发布时间,股价应声大跌

  • 苹果与谷歌合作,云端直接迁移照片 / 视频

  • 马斯克:未来机器人的数量将远远超过人类

797a4261c115868125541d40c2c347f4.png

国内外 AI 要闻

OpenAI 创建了五个级别来显示其在 AI 方面的进展,目前已接近第二级

OpenAI 发言人于当地时间 7 月 11 日表示,OpenAI 在 7 月 9 日的公司全体会议上与员工分享了新的分类系统,计划与投资者和公司外部人士分享这些等级的信息。OpenAI 的系统划分了五个 AI 水平,按一到五的数字由低到高排列等级,来跟踪其在通用人工智能方面的进展:聊天机器人、推理者、代理、创新者和组织,并表示其已接近第二级。该公司认为,其技术在迈向通用人工智能的道路上正接近五个级别中的第二个级别。

0df4d5b5da34aad54c0f1e820c674871.png

OpenAI 的高管告诉员工,公司认为目前自身产品处于第一级,但即将达到第二级,也就是,可以完成基本问题解决任务的系统,类似于拥有博士学位但无法使用任何工具的人。(彭博社)

谷歌使用 Gemini AI 训练其机器人进行导航并完成任务 

Google 正在使用 Gemini AI 训练其机器人,以便它们能够更好地导航和完成任务。Google DeepMind 的一篇研究论文详细介绍了 Gemini 1.5 Pro 的 1M-token 上下文窗口如何让 Google 的机器人 RT-2 使用简单的指令进行导航和完成任务。这项技术的工作原理是拍摄指定区域的视频,研究人员使用 Gemini 1.5 Pro 让机器人“观看”视频以了解环境。然后,机器人可以根据观察到的情况,使用口头或图像输出执行命令。 

DeepMind 表示,其 Gemini 驱动的机器人在 9,000 多平方英尺的操作区域内对 50 多条用户指令的成功率达到 90%。尽管根据研究报告,机器人确认每个请求后明显的切换掩盖了处理这些指令需要 10-30 秒的时间。我们可能还需要一段时间才能与更先进的环境地图机器人共享我们的家园,但至少这些机器人可能能够找到我们丢失的钥匙或钱包。(The Verge)

谷歌发布开源视觉语言模型 PaliGemma 论文 

当地时间 7 月 10 日,谷歌《PaliGemma:用于转移的多功能 3B VLM》论文在 arXiv 上线发布。PaliGemma 是一个开放的视觉语言模型 (VLM),基于 SigLIP-So400m 视觉编码器和 Gemma-2B 语言模型。它经过训练,成为一个多功能且知识面广的基础模型,可有效迁移。它在各种开放世界任务中都表现出色。研究团队在近 40 个不同的任务上评估了 PaliGemma,包括标准 VLM 基准,也包括更专业的任务,例如遥感和分割。今年 5 月中旬,谷歌推出了一款名为 PaliGemma 的开源视觉语言模型,该模型结合了图像处理和语言理解的能力,旨在支持多种视觉语言任务,如图像和短视频字幕生成、视觉问答、图像文本理解、物体检测、文件图表解读以及图像分割等。 

论文地址:https://arxiv.org/abs/2407.07726

凯茜·伍德再谈英伟达:短期内将面临挑战 

在最近的一封致投资者信中,方舟投资管理公司 CEO 凯茜·伍德指出英伟达在短期内面临挑战。她写道:“鉴于短期预期过高,甚至可能无法实现,客户可能会重新评估他们的人工智能战略,导致英伟达的业务在短期内出现一些消化不良。”但是她在信中也同时强调了对英伟达的早期投资在她的公司业绩中的关键作用,并且她认为英伟达是人工智能领域的关键参与者。(新浪财经)

AI 模型可为癌症患者选择最佳疗法,DeepPT 登上 Nature 

来自澳大利亚国立大学、美国国家癌症研究所和 Pangea Biomed 制药公司的科学家,成功开发出一种人工智能(AI)模型“DeepPT”,可以帮助医生为癌症患者选择最佳疗法。相关研究论文发表于最新一期《自然·癌症》杂志。(科技日报)

上海交大机器人专家王贺升加入 UniX AI,担任首席科学家 

智能公司 UniX AI 宣布上海交大机器人专家王贺升教授加入公司,担任公司首席科学家。加入 UniX AI 后,王贺升教授将会在技术开发、产品迭代、团队建设等方面开展工作。(36氪)

全新的 Transformer 加速技术 FlashAttention-3 发布

一种新的 Transformer 加速技术——FlashAttention-3 已经发布,它承诺大幅降低大语言模型(LLMs)的推理速度和成本。与之前的 FlashAttention 相比,FlashAttention-3 在各个方面都有显著的提升。它实现了更高效的 GPU 利用率,使 LLMs 的训练和运行速度比以前快 1.5 - 2 倍。此外,它在较低精度下表现更好,能够使用 FP8 数字同时保持准确性。通过加速注意力机制,FlashAttention-3 还使 AI 模型能够更有效地处理更长的文本片段。这一突破性技术将彻底改变自然语言处理和机器学习领域。

项目链接:https://github.com/Dao-AILab/flash-attention

Firecrawl 推出创新工具 SmartCrawl:将网站转化为 API

知名爬虫服务 Firecrawl 即将推出一款名为 SmartCrawl 的新工具,该工具能够将任何网站转换成 API。目前,SmartCrawl 正处于测试阶段,用户可以加入候补名单,以获得早期访问权限。根据介绍,用户通过简单的设置即可开始使用 SmartCrawl,无需复杂的配置,轻松将所需网站的数据结构化为 API 形式,以便快速访问和集成。

软银收购英国人工智能芯片制造商 Graphcore 

日本软银集团最终以未公开的金额确认收购了英国人工智能芯片初创公司Graphcore。对待此次交易,Graphcore 的态度始终相对保守,彼时2023年9月面对收购传闻,该公司直接否认“收到软银的收购要约”。 

Graphcore 公司 CEO 奈杰尔·图恩(Nigel Toon)表示:“我们不会透露与软银的交易细节,有关未来的结果,我们拭目以待。”图恩在周四的新闻发布会上如是说。此外,他也直接否认了市场传言的5亿美元售价,表示5亿美元的数字并不准确。 

Graphcore 于 2016 年在布里斯托尔成立,该公司设计了一种新型处理器,称为“智能处理单元”(IPU),与 Nvidia 等公司开发的图形处理单元(GPU)不同。虽然两者都能加速计算,但 IPU 具有不同的架构,专为 AI 工作负载而设计。Graphcore 将其芯片定位为 GPU 的更高效替代品,专注于支持大规模并行处理和执行复杂的机器学习模型,其中模型和数据紧密耦合。(TechCrunch)

IDC:Vision Pro 今年销量预计不会超过 50 万台 

市场调研机构 IDC 数据显示,售价 3500 美元的苹果 Vision Pro 混合现实头戴设备自2月在美国推出以来当季销量尚未达到 10 万台,并且面临当前季度美国销量下降 75%。Vision Pro 今年销量预计不会超过 50 万台。该产品于 6 月底在国际市场推出。(IDC)

法国 Bioptimus 发布疾病诊断人工智能模型 

聚焦于将最前沿 AI 技术与医疗科学以及生物技术全面结合的法国初创公司 Bioptimus,近日重磅发布全新的人工智能大模型,该大模型经由 AI 训练系统而打造,训练过程基于数以亿计的专业图像/庞大数据库。该初创公司表示,这一最新的AI大模型将全面有助于各种疾病的研究工作进程以及协助医生加速疾病诊断效率。 

这家总部位于巴黎的公司在一份声明中表示,新推出的名为“H-optimus-0”的AI模型能够执行极度复杂的医学诊断任务,包括精准识别癌细胞和检测肿瘤中的遗传异常。Bioptimus 将该人工智能系统描述为最大规模的开源且可广泛访问的病理学 AI 大模型。(彭博社)

Fireworks AI 获 5200 万美元融资,估值达 5.52 亿美元 

人工智能初创公司 Fireworks AI 在红杉资本领投的一轮融资中获得了 5.52 亿美元的估值。红杉资本、英伟达、AMD、MongoDB 等投资者参与了本轮融资,向 Fireworks AI 投资了5200万美元,使得该公司的现金总额增至 7700 万美元。Fireworks AI 提供的工具使企业能够微调和定制人工智能模型,以满足其特定的业务需求。企业可以通过 Fireworks AI 的平台访问超过 100 个模型,这有助于企业更有效地利用人工智能技术,提升业务效率和创新能力。

为智能城市提供视觉 AI 解决方案的 Hayden AI 完成 9000 万美元 C 轮融资 

Hayden AI  为城市提供视觉 AI 工具,以提高可持续性、交通安全性和可达性,已完成由 TPG 旗下 The Rise Fund 领投的 9000 万美元 C 轮融资。其他参投方包括 Drawdown Fund 和 Autotech Ventures 等。Hayden AI 是一家总部位于加利福尼亚州旧金山的公司,专门为智能城市提供视觉 AI 解决方案。(FinSMEs)

无人驾驶算账,每天成本 471 元 

按照武汉市交通运输局对媒体的说法,现在萝卜快跑在当地运营 400 多辆无人驾驶出租车,都是 Apollo 第五代车。此前,百度副总裁、自动驾驶技术部总经理王云鹏提到,Apollo第五代无人车各项成本总计 48 万元,且车辆可确保 5 年内的可靠运营。 

有媒体计算,车的成本按 5 年分摊每天是 263 元。现役运行的车辆中大约需要 300 名安全员,武汉 “自动驾驶安全员”月薪为 5000 至 7000 元。所有安全员一个月工资约 170 万元分摊到 450 辆车,单车单日的安全员成本约为 126 元。加上充电费用 35 元、洗车 10 元、运维费用 30 元,单车日均运营费用总计约 75 元。萝卜快跑第五代车的单日运营成本为 263 元 + 126 元 + 75 元 = 471 元。(晚点财经)

特斯拉推迟无人驾驶出租车 Robotaxi 发布时间,股价应声大跌 

彭博社援引知情人士消息称,特斯拉计划将无人驾驶出租车 Robotaxi 的发布时间推迟到 10 月份,以便项目团队有更多时间制造更多原型样车。知情人士表示,约两个月的延迟已在内部传达,设计团队本周被告知要修改 Robotaxi 的某些元素。 

特斯拉首席执行官埃隆·马斯克几个月将发布日期定在 8 月 8 日,对活动的乐观情绪推动公司股价连续 11 天上涨,市值增加超过 2,570 亿美元。在彭博社报道 Robotaxi 发布推迟后,特斯拉股价应声大跌。美股收盘,特斯拉报 241.03 美元,跌 8.44%,终结 11 连涨,市值一夜蒸发 709 亿美元。

苹果与谷歌合作,云端直接迁移照片 / 视频 

欧盟数字市场法案要求服务提供商允许用户在不同服务商间转移数据,苹果和谷歌合作推出了一项新功能,使用户能直接将 iCloud 相册中的照片和视频转移到谷歌相册,反之亦然。这项服务并非仅限于欧盟地区,而是面向全球用户。苹果提醒用户,传输过程可能需要数小时至数天,且某些文件类型无法传输。

马斯克:未来机器人的数量将远远超过人类 

当地时间周三,英国计算机科学家、人工智能初创公司 Stability AI 与 Schelling AI 的联合创始人埃马德·莫斯塔克(Emad Mostaque)在 X 上发帖称:“中国将成为第一个拥有 1 亿个机器人的国家,然后是 10 亿个机器人,超出所有人的预料。”马斯克对此表示:“未来机器人的数量将远远超过人类。”(新浪财经)

3270d45616371b5c54e6c32fd19066cb.gif

3d1f8651eb464948713a9154857925c2.jpeg

  • 19
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值