20240313 大模型快讯

//社区生态//

  1. 基于字节的Transformer模型bGPT发布。微软亚研院发布基于字节的Transformer模型bGPT,将不同类型的数据纳入同一框架之下,可以生成文本、图像和音频,模拟计算机行为。

//行业落地//

  1. 全球首位AI软件工程师Devin诞生。Cognition推出AI软件工程师Devin,掌握全栈技能,云端部署、底层代码、改bug、训练和微调AI模型。

//多模态大模型//

  1. 清华&阿里合作推出「概念半透膜」模型。清华大学和阿里安全联合发布的概念半透膜模型,可在 Diffusion 架构的 AI 作图模型中,精准、可控地擦除各类具象或抽象概念,并几乎完全保留无关概念。

  2. DiT训练提速10倍方法推出。来自Sea AI Lab等研究团队提出Masked Diffusion Transformer,利用mask modeling表征学习策略可加速Diffusion Transfomer训练至10倍。

//智能体//

  1. 通用计算机控制智能体框架 Cradle提出。北京智源人工智能研究院提出智能体控制框架 Cradle,使智能体不依赖任何内部 API 直接控制键盘、鼠标和任何软件交互。

//基础技术//

  1. Meta 宣布推出两个 24k GPU 集群。Meta 会持续扩大基础设施建设,到 2024 年底将包括 350000 个 NVIDIA H100 GPU,其计算能力将相当于近 600000 个 H100。

  • 23
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值