这段时间我对比的10+个AI语言类大模型_典型大语言模型对比-CSDN博客

本文链接：https://blog.csdn.net/qq_41771196/article/details/140219290

2022年11月ChatGPT推出，自然语言处理领域取得重大突破，正式进入大模型时代，2023年3月，具备多模态能力的GPT-4惊艳发布（2023年被称为“大模型元年”）海内外科技巨头、研究机构等纷纷跟进；2024年2月Sora面世，大模型在视频生成领域实现代际跃迁，虚拟现实成为可能。在此背景下，我想先谈谈第一阶段，12个自然语言处理平台。因为现在只有语言类大模型有较多厂商躬身入局，

科普：当前所有AI产品的位置——第一阶段

目前大模型能力仍处于EmergingAGI水平，就模型成熟度而言，语言大模型>多模态大模型>具身智能大模型。根据DeepMind的定义，AGI应能够广泛学习、执行复杂多步骤的任务。模型的AGI水平可分为Level-0至Level-5共6个等级，现阶段大模型在处理任务的广泛性上还有很大提升空间，即使是国际顶尖的大模型也仍处于Level-1阶段。

参考下图：

我的体验：当前主流语言大模型清单（有遗漏可以提醒我）

1.gpt3.5:综合能力最强

GPT-3是由OpenAI研究团队开发的一个自然语言生成模型，具有生成高质量自然语言文本的能力，是目前自然语言处理领域的最先进技术之一。GPT-3的模型结构是一个基于Transformer的神经网络模型，其参数数量超过了175亿个。该模型能够完成自然语言生成、语言理解、文本摘要等任务。

2.商汤商量：

信息价值挖掘方面的能力较强

但直接信息的整合罗列较弱（案例：提问介绍下紫东太初的时候无法回答）

"商量"是由商汤科技研发的一款基于自然语言处理技术的人工智能大语言模型。这款模型具有强大的语言理解和生成能力，能够将科技与人文相互交融。作为一款高效的聊天助手，它可以迅速解答复杂的问题，提供定制化的建议，还能辅助创作高质量的文本。同时，它还具备不断学习和进化的特性。

3.讯飞星火：

讯飞星火认知大模型是科大讯飞研发的认知智能大模型，可以和人类进行自然交流，提供包括语言理解、问答、推理等各类认知智能服务，高效完成各领域认知智能需求。

4.文心一言3.5：

文心一言是百度开发的一种全新的大型语言模型，其设计理念是通过一对一的对话形式进行交互，从而与人进行对话，解答问题，协助创作。文心一言在各种应用场景中，如文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成等，都能提供高效便捷的服务，帮助人们获取信息、知识和灵感。

5.天工：

"天工"是由昆仑万维与奇点智源联合研发的一款对话式AI助手。它是国内首个对标ChatGPT的双千亿级大语言模型。天工AI可以通过自然语言与用户进行问答式交互，能够满足用户多元化的需求，如文案创作、知识问答、代码编程、逻辑推演、数理推算等。

6.腾讯混元：

腾讯混元是由腾讯公司研发的一款大语言模型，它在2023年9月7日的腾讯全球数字生态大会上正式发布。该模型具有强大的中文创作能力、复杂的语境下的逻辑推理能力，以及可靠的任务执行能力。

7.智谱清言：

智谱清言是由北京智谱华章科技有限公司推出的一款生成式AI助手。该软件于2023年8月31日正式上线，旨在工作、学习和日常生活中为用户提供解答各类问题和完成各种任务的服务。智谱清言基于智谱AI自主研发的中英双语对话模型ChatGLM2，该模型经过了万亿字符的文本与代码预训练，并采用了有监督微调技术，以通用对话的形式为用户提供智能化服务。

8.百川：

百川智能的主要产品是百川大模型，这是一系列大语言模型，包括Baichuan-7B、Baichuan-13B和Baichuan 3等。这些模型在知识问答、文本创作等领域表现出色，特别是在诗词创作的格式、韵律、表意等方面展现了优异的能力。例如，Baichuan 3是一个超千亿参数的大语言模型，它在多个权威通用能力评测中取得了优异的成绩，如CMMLU、GAOKAO和AGI-Eval等。

9.通义千问：

10.紫东太初

紫东太初是由中国科学院自动化研究所、武汉人工智能研究院与华为联合研发的全球首个图文音（视觉-文本-语音）三模态预训练模型。这个跨模态通用人工智能平台以多模态大模型为核心，基于全栈国产化基础软硬件平台，可支撑全场景AI应用。紫东太初的核心原理是视觉、文本、语音不同模态通过各自编码器映射到统一语义空间，然后通过多头自注意力机制学习模态之间的语义关联以及特征对齐，形成多模态统一知识表示，再利用编码后的多模态特征，通过解码器分别生成文本、图像和语音

11.Minimax

MiniMax是一家成立于2021年12月的中国初创公司，专注于开发AI解决方案。该公司拥有自研的文本到视觉、文本到语音以及文本到文本三个基础模型。MiniMax的核心业务包括推出自研通用大模型“ABAB”，以及虚拟聊天软件Glow、生成式对话AI产品Inspo等。2023年，MiniMax的ABAB大模型获得了上线批准，同年公司完成了新一轮2.5亿美元融资，整体估值超过12亿美元。此外，MiniMax还计划发布国内首个基于MoE（Mixture-of-Experts）架构的大模型

12.雅意

雅意大模型（YAYI 2）是由中科闻歌研发的新一代开源大语言模型。这个模型使用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练，具有 300亿参数规模。它基于国产化算力支持，数据语料安全可控，并且模型架构是全自主研发的。雅意大模型在媒体宣传、舆情感知、政务治理、金融分析等多个场景中显示出强大的应用能力。它不仅覆盖多种语言，而且在垂直领域有深入的应用，并且是开源开放

我给的建议：

综合体验第一梯队：GPT3.5、商汤、百度文心一言、讯飞星火

第二梯队：腾讯混元、MINIMAX、天工、智普（与天工很类似）、百川

其他：通义千问、紫东、雅意