Meta 推出新型多模态 AI 模型“变色龙”（Chameleon），挑战 GPT-4o，引领多模态革命

最新推荐文章于 2025-05-03 09:07:35 发布

喜好儿网

最新推荐文章于 2025-05-03 09:07:35 发布

阅读量3.7k

点赞数 8

文章标签：人工智能 Meta AI模型变色龙 Chameleon GPT-4o

本文链接：https://blog.csdn.net/heehelcom/article/details/139070781

版权

在人工智能领域，Meta 近日发布了一款名为“变色龙”（Chameleon）的新型多模态 AI 模型，旨在挑战 OpenAI 的 GPT-4o，并刷新了当前的技术标准（SOTA）。这款拥有 34B 参数的模型通过 10 万亿 token 的训练，不仅展现了强大的跨模态处理能力，还预示着多模态模型未来的发展方向。

官方介绍：https://the-decoder.com/metas-chameleon-ai-model-blends-text-and-images-hinting-at-a-future-gpt-4o-rival/

AIGC专区：
https://heehel.com/category/aigc

更多消息：
https://heehel.com/category/ai-news

一、Chameleon 模型简介

Chameleon 模型是 Meta AI 推出的新型多模态基础模型，其最大特点在于采用统一的 Transformer 架构，将文本、图像和代码等不同模态的信息作为离散标记进行处理。与以往的模型不同，Chameleon 摒弃了针对不同模态的单独编码器或解码器，通过“早期融合”方法将所有模态从一开始就投影到一个共同的表示空间中，实现了跨模态的无缝推理和生成。

二、技术挑战与创新

虽然“早期融合”方法带来了显著的性能提升，但也给 Meta 团队带来了重大的技术挑战。在训练稳定性和可扩展性方面，Meta 引入了架构创新和训练技术，如 QK 归一化和 Zloss 等训练技巧，以优化模型的性能。