OpenAI 或将进军搜索,冲击谷歌/Perplexity;国产具身智能初现,宣称灵活度媲美成年人 | AI 头条...

989c9fdc0057491569a391affd7b218f.gif

整理 | 王启隆

出品 | AI 科技大本营(ID:rgznai100)

487ae3132478d32a22cccb4f625783be.png

一分钟速览新闻点!

  • 苹果开源 Corenet,赋能深度神经网络训练

  • Synthesia 升级 AI 数字人平台,引入“智能情感头像”

  • Dropzone AI 获 1685 万美元融资,推进自主网络安全 AI 代理以大幅降低人工干预

  • Interactive3D:国产交互式精细调控与高效三维模型生成

  • OpenAI 或研发“Sonic-SNC(SearchGPT)”,打造 Perplexity 竞品

  • Meta 推出 LayerSkip 技术,大幅提升大语言模型推理效率

  • 国产星尘智能 AI 机器人 S1:仿人操作、高效学习

527849978045a67711d8b404ad683815.png

全球 AI 要闻

苹果开源 Corenet,赋能深度神经网络训练

苹果公司日前宣布开源 CoreNet,一个专为训练深度神经网络设计的综合性库。该库旨在支持研究人员与工程师高效构建并训练包括基础模型(如 CLIP、LLM)在内的多种大小模型,覆盖对象分类、检测、语义分割等多种任务。CoreNet 基于已开源的 CVNets 演进,拓展至计算机视觉以外的广泛应用场景,尤其强调对基础模型训练的促进作用。

目前,苹果已运用 CoreNet 推进多项前沿研究,如 OpenELM 的开源语言模型框架、CatLIP 的高速视觉识别、Reinforce Data 项目提升模型准确性和鲁棒性、以及 FastVit、MobileOne 等高效模型结构的研发。此外,CoreNet 0.1.0 版本已集成 OpenELM、CatLIP 及 MLX 示例,展示其在实际应用中的快速落地能力。

开源链接:https://github.com/apple/corenet

Synthesia 升级 AI 数字人平台,引入“智能情感头像”

伦敦科技初创公司 Synthesia 推出“智能情感头像”功能,显著提升其企业级 AI 视频制作平台的表现力。此创新使 AI 头像能依据内容情境,实时调整语音语调、面部表情及身体语言,实现对传统数字头像的重大超越。

与微软近期展示的实验性 VASA 框架不同,“智能情感头像”技术已实际应用,助力用户生成高度逼真的 AI 视频。CTO Jon Starck 指出,新技术不仅创造了生动的数字形象,更引入了具有高保真度的“数字演员”,极大地模糊了虚拟与现实边界。

Dropzone AI 获 1685 万美元融资,推进自主网络安全 AI 代理以大幅降低人工干预

网络安全 AI 开发商 Dropzone AI 宣布完成 1685 万美元的 A 轮融资,由 Theory Ventures 领投,Decibel Partners、Pioneer Square Ventures 和 In-Q-Tel 等现有机构投资者参投。该公司由 Edward Wu 于 2023 年创立,专注于研发预训练的自主 AI 安全代理,旨在辅助人类识别网络威胁,应对全球网络安全人才短缺问题。

Interactive3D:国产交互式精细调控与高效三维模型生成

Interactive3D 是一项由港科大、港中大、商汤研究与上海AI实验室合作研发的交互式三维生成技术,于 CVPR 2024 上发布。该技术采用两阶段架构,首阶段借助 Gaussian Splatting 实现用户对模型构建的直接介入,包括组件增删、刚柔拖拽、几何变换和语义编辑,确保生成过程的精准引导与动态调整。随后,通过 InstantNGP 转换并引入“交互式哈希细化”模块,在第二阶段深化细节与几何提取。

技术演示覆盖刚性拖拽调控恐龙嘴部开合、部件拼接组装高达、哈希细化提升模型精度、语义编辑变更高达武器与翅膀材质、可变形拖拽塑造香蕉形鲸鱼及几何变换开启宝可梦球释放幼龙等场景。Interactive3D 凭借强大的交互性和实时反馈,结合文本指令支持,为用户提供了如玩转三维积木般的灵活创作体验,显著提升了个性化三维内容构建的效率与精度。

论文链接:https://arxiv.org/abs/2404.16510

开源链接:https://github.com/interactive-3d/interactive3d

OpenAI 或研发“Sonic-SNC(SearchGPT)”,打造 Perplexity 竞品

在 ChatGPT 近日的更新中,OpenAI 建立的 http://search.chatgpt.com 新域名引起了广泛讨论。目前 OpenAI 推出了名为“Chat Sonic-SNC (SearchGPT)”的更新,该平台集成图像搜索、多样小工具(如天气、计算器、体育、财经及时间差计算)及后续提问功能,提升用户体验。核心技术融合 GPT-4 Lite(Scallion)、GPT-4 及 GPT3.5 模型,结合 Bing、Sydney、Fortis 及内部搜索引擎 Labrador,实现多源信息深度整合与精准检索,以先进 NLP 技术革新搜索交互。

Meta 推出 LayerSkip 技术,大幅提升大语言模型推理效率

Meta 推出 LayerSkip,旨在显著加快大语言模型(LLM)推理速度。该技术采用训练阶段的层级递增 dropout 策略与早期退出损失函数,优化模型在早期层的提前退出准确性,无需附加辅助层。推理阶段引入自推测解码机制,模型可在早期退出并利用剩余层校验修正,实现更低内存占用与计算资源共享。

实验覆盖多种 Llama 模型尺寸与训练方式,结果显示 LayerSkip 在 CNN/DM 文档摘要、编程及 TOPv2 语义解析任务中分别实现 2.16 倍、1.82 倍与 2.0 倍的推理速度提升,证实其在提升 LLM 推理性能方面的显著成效。

开源链接:https://huggingface.co/papers/2404.16710

国产星尘智能 AI 机器人 S1:仿人操作、高效学习

国产机器人新秀——星尘智能 AI 机器人 S1,以其人类动作模仿学习能力与灵活性引发关注。演示视频中,S1 以与人近乎同步甚至慢放的速度,展现超高速叠杯、倒酒、削菜、操作器械、家居维修、电子设备使用及书法等复杂技能。公司官网强调其使命为推动智能通用机器人走入寻常百姓家。

星尘智能 S1 于 2024 年 4 月历时一年自主研发成功,被誉为“最接近人类操作性能”的 AI 机器人,通过模仿学习,以成人级别速度与灵活度执行各类实用任务。S1 已接入大模型测试,预计年内实现商业化。公司创始人来杰曾任腾讯机器人实验室一号员工、百度“小度机器人”团队负责人等职,带领团队研发出包括腾讯 Ollie 在内的多款机器人产品。公司成立于 2022 年 12 月,总部位于深圳南山区科技生态园。

官网链接:https://astribot.com/

演示视频(Bilibili):https://www.bilibili.com/video/BV1yJ4m1H7V2/

a36235cd0a1c012b3ae514c1c2f11f67.gif

56761db1b839901209bc8ad7d6f2b720.png

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值