大模型日报2024-05-06

大模型日报
2024-05-06

大模型技术

  • 智谱AI 正研发对标Sora的国产文生视频模型,最快年内发布
    摘要: 估值超200亿的国内 A1大模型独角兽公司“智谱 A“正在研发对标OpenAl Sora的高质量文生视频模型,预计最快年内发布。据悉,成立于2019年的智谱 A1,由清华大学计算机系的技术成果转化而来,源自清华大学知识工程(KEG)实验室。智谱 A| 是国内最早入局大模型赛道的公司之一,也是目前国内头部大模型厂商代表之一。

告别偏科,能玩转多模态、多任务、多领域的强化智能体终于来了 | 机器之心

该文章介绍了一种名为Jack of All Trades (JAT)的多模态通用强化学习智能体框架。JAT是基于Transformer的框架,能够处理多种数据类型和模态的任务,并通过同一套参数应对不同复杂度的任务。文章详细介绍了JAT的模型架构和嵌入机制,并提供了相关的论文、代码和数据集链接。实验结果表明,JAT在广泛的任务上能够达到专家水平的表现。

LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向 | 机器之心

Yann LeCun在哈佛大学的演讲中,对自回归LLM进行了批评,并提出了一个模块化的认知架构,该架构的核心是一个可预测的世界模型。他强调AI系统应该朝着能够学习、记忆、推理、规划、有常识、可操纵且安全的方向发展。LeCun还介绍了联合嵌入预测架构(JEPA)作为实现世界模型的解决方案。他认为开源AI不应该因为监管而消失,但也需要设置共享护栏目标。LeCun指出自回归LLM存在事实错误、逻辑错误、不一致、推理有限、毒性等缺陷,仅仅是世界模型的一种简化的特殊情况。

大模型产品

大模型论文

ICLR 2024 Spotlight | NoiseDiffusion: 矫正扩散模型噪声,提高插值图片质量 | 机器之心

该文章介绍了一种名为NoiseDiffusion的方法,用于改善扩散模型在插值图片时的效果。作者指出,扩散模型在插值自然图片时往往效果不佳,因为插值图片的潜在变量不再遵循高斯分布。为了提高插值图片的质量,作者提出了一种新的插值方法,通过改变潜在变量的噪声水平和引入高斯噪声来使其更接近预期的分布。作者还分析了高维空间中潜在变量的正交性,并结合球面线性插值法和直接引入噪声的方法,提出了NoiseDiffusion方法。该方法能够在保留原图信息的同时,显著提高自然图片的插值结果。

🔗:ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务 | 机器之心

该文章介绍了一种名为NegLabel的创新方法,利用视觉-语言模型(VLMs)进行分布外(Out-of-Distribution, OOD)检测。该方法通过引入“负标签”机制,利用VLMs模型的语义差异来区分分布外样本,从而提高模型对OOD样本的识别能力。实验结果表明,NegLabel在多个零样本OOD检测基准测试中表现出优越性能,达到了94.21% AUROC和25.40% FPR95。与以往基于VLMs的OOD检测方法相比,NegLabel不需要额外的训练过程,且具有更优越的性能。

大模型开源项目

以上就是2024-05-06的大模型日报。

  • 7
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值