大模型日报
2024-05-06
大模型技术
- 智谱AI 正研发对标Sora的国产文生视频模型,最快年内发布
摘要: 估值超200亿的国内 A1大模型独角兽公司“智谱 A“正在研发对标OpenAl Sora的高质量文生视频模型,预计最快年内发布。据悉,成立于2019年的智谱 A1,由清华大学计算机系的技术成果转化而来,源自清华大学知识工程(KEG)实验室。智谱 A| 是国内最早入局大模型赛道的公司之一,也是目前国内头部大模型厂商代表之一。
告别偏科,能玩转多模态、多任务、多领域的强化智能体终于来了 | 机器之心
该文章介绍了一种名为Jack of All Trades (JAT)的多模态通用强化学习智能体框架。JAT是基于Transformer的框架,能够处理多种数据类型和模态的任务,并通过同一套参数应对不同复杂度的任务。文章详细介绍了JAT的模型架构和嵌入机制,并提供了相关的论文、代码和数据集链接。实验结果表明,JAT在广泛的任务上能够达到专家水平的表现。
LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向 | 机器之心
Yann LeCun在哈佛大学的演讲中,对自回归LLM进行了批评,并提出了一个模块化的认知架构,该架构的核心是一个可预测的世界模型。他强调AI系统应该朝着能够学习、记忆、推理、规划、有常识、可操纵且安全的方向发展。LeCun还介绍了联合嵌入预测架构(JEPA)作为实现世界模型的解决方案。他认为开源AI不应该因为监管而消失,但也需要设置共享护栏目标。LeCun指出自回归LLM存在事实错误、逻辑错误、不一致、推理有限、毒性等缺陷,仅仅是世界模型的一种简化的特殊情况。
大模型产品
- 技术的新军备竞赛:打造AI的十亿美元之战
摘要: 在AI产业中,小型且专业化的模型变得至关重要,它们为各种细分应用提供了必要的能力。
大模型论文
- 智谱AI 正研发对标Sora的国产文生视频模型,最快年内发布
摘要: 此次研讨会将探讨生成式人工智能的基础,分析其在当前技术生态系统中的应用和发展前景。
ICLR 2024 Spotlight | NoiseDiffusion: 矫正扩散模型噪声,提高插值图片质量 | 机器之心
该文章介绍了一种名为NoiseDiffusion的方法,用于改善扩散模型在插值图片时的效果。作者指出,扩散模型在插值自然图片时往往效果不佳,因为插值图片的潜在变量不再遵循高斯分布。为了提高插值图片的质量,作者提出了一种新的插值方法,通过改变潜在变量的噪声水平和引入高斯噪声来使其更接近预期的分布。作者还分析了高维空间中潜在变量的正交性,并结合球面线性插值法和直接引入噪声的方法,提出了NoiseDiffusion方法。该方法能够在保留原图信息的同时,显著提高自然图片的插值结果。
🔗:ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务 | 机器之心
该文章介绍了一种名为NegLabel的创新方法,利用视觉-语言模型(VLMs)进行分布外(Out-of-Distribution, OOD)检测。该方法通过引入“负标签”机制,利用VLMs模型的语义差异来区分分布外样本,从而提高模型对OOD样本的识别能力。实验结果表明,NegLabel在多个零样本OOD检测基准测试中表现出优越性能,达到了94.21% AUROC和25.40% FPR95。与以往基于VLMs的OOD检测方法相比,NegLabel不需要额外的训练过程,且具有更优越的性能。
大模型开源项目
- ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务 | 机器之心
摘要: 研究人员创建了一个基于大型语言模型的方法,旨在从临床笔记中提取结构化数据,以便于进一步的分析和使用。
以上就是2024-05-06的大模型日报。