AI 大型语言模型有哪些？

最新推荐文章于 2024-07-24 17:13:36 发布

玩人工智能的辣条哥

最新推荐文章于 2024-07-24 17:13:36 发布

阅读量346

点赞数 1

分类专栏：人工智能文章标签：人工智能语言模型自然语言处理

原文链接：https://baike.baidu.com/starmap/view?nodeId=783743685b98e22674f17d07&lemmaTitle=Gemini&lemmaId=63729669&starMapFrom=lemma_starMap&fromModule=lemma_starMap

版权

人工智能专栏收录该内容

27 篇文章 1 订阅

订阅专栏

问题描述：

AI 大型语言模型

解答：

ChatGPT

公司：OpenAI

ChatGPT（全名：Chat Generative Pre-trained Transformer），是OpenAI研发的一款聊天机器人程序，于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够基于在预训练阶段所见的模式和统计规律，来生成回答，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写论文、邮件、脚本、文案、翻译、代码等任务。2023年4月10日，中国支付清算协会倡议支付行业从业人员谨用ChatGPT。2023年4月12日，此前临时禁止使用ChatGPT的意大利开出了解禁的条件，但13日，西班牙国家数据保护局和法国国家信息自由委员会分别宣布对ChatGPT展开调查。同日，欧洲数据保护委员会宣布成立专门工作组，以促进各国协同调查，并就各数据保护部可能采取的执法措施交流信息。2023年7月，OpenAI发布公告称给ChatGPT加了一个名为Custom instructions的新功能：在系统层面给聊天机器人定制化一些指令，令机器人更具有个性化特色的同时，更好地贴近使用者的需求。当地时间7月25日，OpenAI宣布，安卓版ChatGPT已正式上线。2023年11月，OpenAI前总裁兼董事长Greg Brockman宣布，所有用户均可使用其语音功能ChatGPT Voice。

文心一言

公司：百度

文心一言（英文名：ERNIE Bot）是百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动、回答问题、协助创作，高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习，得到预训练大模型，在此基础上采用有监督精调、人类反馈强化学习、提示等技术，具备知识增强、检索增强和对话增强的技术优势。2023年3月16日，百度新一代大语言模型文心一言正式启动邀测。2023年8月31日，文心一言率先向全社会全面开放。开放首日，文心一言共计回复网友超3342万个问题。2023年12月28日，百度首席技术官王海峰在第十届WAVE SUMMIT深度学习开发者大会上宣布文心一言用户规模已突破1亿。

讯飞星火认知大模型

公司：科大讯飞

讯飞星火认知大模型是科大讯飞发布的大模型。该模型具有7大核心能力，即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互，该模型对标ChatGPT。2023年5月6日，科大讯飞正式发布讯飞星火认知大模型并开始不断迭代；6月9日，星火大模型V1.5正式发布；8月15日，星火大模型V2.0正式发布；9月5日，星火大模型正式面向全民开放；10月24日，星火大模型V3.0正式发布；2024年1月30日，星火大模型V3.5正式发布。讯飞星火认知大模型已位列中国头部水平，通过中国信通院组织的AIGC大模型基础能力（功能）评测及可信AI大模型标准符合性验证，并获得4+级评分。

通义千问

公司：阿里云

通义千问，是阿里云推出的一个超大规模的语言模型，功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互，也融入了多模态的知识理解，且有文案创作能力，能够续写小说，编写邮件等。2023年4月7日，“通义千问”开始邀请测试，4月11日，“通义千问”在2023阿里云峰会上揭晓。4月18日，钉钉正式接入阿里巴巴“通义千问”大模型。2023年9月13日，阿里云宣布通义千问大模型已首批通过备案，并正式向公众开放。通义千问APP在各大手机应用市场正式上线，所有人都可通过APP直接体验最新模型能力。12月1日消息，阿里云开源通义千问720亿参数模型。2023年12月22日，阿里云通义千问成为首个“大模型标准符合性评测”中首批通过评测的四款国产大模型之一，在通用性、智能性等维度均达到国家相关标准要求。

腾讯混元大模型

公司：腾讯

腾讯混元，腾讯自主研发的通用大语言模型。腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预训练语料超2万亿tokens，具有强大的中文理解与创作能力、逻辑推理能力，以及可靠的任务执行能力。2023年9月6日，微信上线“腾讯混元助手”小程序。9月7日，腾讯正式发布混元大模型。9月15日，腾讯混元大模型首批通过备案。10月26日，腾讯混元大模型正式对外开放“文生图”功能。

天工

公司：昆仑万维

天工大模型是由昆仑万维自研的双千亿级大语言模型。2023年4月17日，昆仑万维正式发布大语言模型“天工”，即日起启动邀请测试。2023年7月6日，天工AI助手App正式上线。2023年8月23日，昆仑万维推出国内第一款AI搜索产品——“天工AI搜索”。2023年11月3日，昆仑万维“天工”大模型通过《生成式人工智能服务管理暂行办法》备案，面向全社会开放服务。2024年2月6日，昆仑万维正式发布新版MoE大语言模型“天工2.0”。

ChatGLM

公司：清华大学

ChatGLM，清华技术成果转化的公司智谱AI研发的支持中英双语的对话机器人。

盘古Chat

公司：华为

“盘古Chat”是华为公司旗下一款直接对标ChatGPT的多模态千亿级大模型产品。

思必驰DFM-2大模型

公司：思必驰

思必驰自研的对话式语言大模型DFM-2（Dialogue Foundation Model），中文直译为“通用对话基础模型”，中文取首字母谐音“东风”，显示将用大模型助力行业实现“沟通万物、打理万事”。思必驰DFM-2大模型是思必驰研发的技术。2023年7月12日，思必驰正式发布DFM-2大模型。DFM-2 属于垂域大模型，是具有通用智能、针对垂域的行业语言大模型。可以实现通用人工智能的柔性定制,开展大规模、高质量、个性化的人工智能系统定制。

ChatJD

公司：京东
ChatJD是由京东推出的产业版ChatGPT。

ChatLaw

公司：北京大学信息工程学院
2023年7月，北大团队发布了中文法律大模型ChatLaw，为大众提供普惠法律服务。模型支持文件、语音输出，同时支持法律文书写作、法律建议、法律援助推荐。

Grace

公司：字节跳动
Grace，字节跳动旗下的一款AI对话类产品。2023年6月9日消息，字节跳动内部测试“Grace”，该产品处于测试完善的阶段。

LightGPT
公司：恒生电子
LightGPT是恒生电子发布的金融行业大模型。

MOSS
公司：复旦大学
MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型。2023年2月20日，解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉，MOSS已由邱锡鹏教授团队发布，邀公众参与内测。2月21日，该平台发布公告，感谢大家的关注，同时也指出，MOSS还是一个非常不成熟的模型，距离ChatGPT还有很长的路需要走。

360智脑
公司：360
360智脑是360自研认知型通用大模型，依托360多年积累的大算力、大数据、工程化等关键优势，集成360GPT大模型、360CV大模型、360多模态大模型技术能力，具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能，重塑人机协作新范式。为服务产业数字化，360发布企业级AI大模型战略，以人为本，构建安全可信大模型。2023年3月29日，360智脑大模型1.0版本发布。 6月13日，大模型升级至4.0版本，数字人、多模态应用、360全端应用等成果落地。

拓世大模型

公司：拓世科技
拓世大模型是拓世科技集团开发的具有巨大规模和复杂结构的人工智能大语言模型，拥有数万亿个参数，通过在庞大的数据集上进行训练，以AI为核心，构建了一个全面的数字化生态系统，可处理包括自然语言、图像、声音等在内的多种形式信息，具备理解和生成高质量内容的能力。2023年6月10号，拓世科技集团AI+战略暨AIGC拓世大模型发布会上正式发布拓世大模型

TechGPT
公司：东北大学
TechGPT，是中国东北地区首个全量微调并开源的大模型。

鸿湖

公司：中国联通
鸿湖是中国联通图文大模型，该模型训练参数达20亿，支持以文生图、以图生图、视频剪辑等多样化的AI能力。

日日新

公司：商汤科技
日日新（SenseNova），是商汤科技宣布推出的大模型体系，包括自然语言处理模型“商量”（SenseChat）、文生图模型“秒画”和数字人视频生成平台“如影”（SenseAvatar）等。2023年4月，商汤科技董事长兼首席执行官徐立宣布推出“日日新SenseNova”大模型体系。2023年8月，日日新大模型获批上线。

天河天元

公司：国家超级计算天津中心
天河天元是国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据，以及专业领域的中医、医药、问诊、法律等多种数据集，训练数据集总 token 数达到 350B，最终训练打造出的中文语言大模型。

天擎
公司：美亚柏科
天擎是美亚柏科发布的国内首个公共安全大模型。

梧桐
公司：宇视科技
梧桐是宇视科技发布的宇视AIoT（人工智能物联网）行业大模型。2023年5月9日，宇视科技发布行业大模型“梧桐”。

悟道·天鹰

公司：智源人工智能研究院
“悟道·天鹰”是北京智源人工智能研究院发布的语言大模型。

小可

公司：电科太极
小可，电科太极发布的生成式人工智能大模型产品。2023年6月9日，中国电科所属电科太极在京正式发布“小可”。

序列猴子

公司：出门间间
“序列猴子”，是李志飞研发的大模型产品，该大模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度，能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。

轩辕

公司：度小满
“轩辕”是度小满开源的国内首个千亿级中文金融大模型，轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来，在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上，效果相较于通用大模型大幅提升，表现出明显的金融领域优势。千亿级的轩辕模型已可以在Huggingface中申请下载，面向所有金融机构开放。

长虹超脑
公司：长虹
长虹超脑是依托于多模态交互，语义理解及意图识别，大数据等技术构建起的人工智能超脑系统，号称具备能感知、能理解、能学习三大核心能力；可应用于日常生活答疑，专业领域探索以及个性化服务等方面；搭载于长虹电视上，以数字形象“长虹小白”的形式与用户交互，并执行指令。

贞仪
公司：蚂蚁集团
贞仪，是蚂蚁集团的技术研发团队正在自研语言和多模态大模型。

紫东太初

公司：中科院
紫东太初，是中国科学院自动化研究所研发的跨模态通用人工智能平台。全球首个图文音（视觉-文本-语音）三模态预训练模型（OPT-Omni-Perception pre-Trainer），同时具备跨模态理解与跨模态生成能力，取得了预训练模型突破性进展。“紫东太初”跨模态通用人工智能平台以多模态大模型为核心，基于全栈国产化基础软硬件平台，可支撑全场景AI应用。多模态预训练模型被广泛认为是从限定领域的弱人工智能迈向通用人工智能路径的探索。自动化所“紫东太初”跨模态通用人工智能平台瞄准成为实现通用人工智能的开天之斧，在智能世界混沌初开之际开辟新局。2023年6月16日，中国科学院自动化研究所发布紫东太初2.0。2023年8月，中科院旗下紫东太初的大模型位列首批通过《生成式人工智能服务管理暂行办法》备案的名单，可正式上线面向公众提供服务。

TigerBot

公司：虎博科技
　TigerBot是一款由国内团队虎博科技自研的多语言任务大模型，覆盖生成、开放问答、编程、画图、翻译、头脑风暴等15大类能力，支持子任务超过60种，且支持插件。

商量

公司：商汤科技
商量（SenseChat），是商汤科技旗下的中文语言大模型应用平台。2023年4月10日，商汤科技举办技术交流日活动。商汤研发的大语言模型被命名为“商量SenseChat”。2023年8月31日，商汤科技官宣，商汤日日新大模型旗下自然语言应用“商量SenseChat”正式面向用户开放服务。

书生·浦语

公司：上海人工智能实验室
上海人工智能实验室与商汤科技联合香港中文大学、复旦大学发布新一代大语言模型书生·浦语2.0（InternLM2）。这个大模型包含70亿和200亿两种参数规格，以及基座、对话等版本，向全社会开源并提供免费商用授权。在55个主流评测集上，InternLM2与多个同量级模型接受了综合评测，结果显示：InternLM2的轻量级（70亿参数）和中量级（200亿参数）版本性能处于领先水平；200亿参数版本尽管只是中等规模，但在整体表现上达到了与ChatGPT比肩的水平。

Gemini

公司：谷歌
Gemini是一款由Google DeepMind（谷歌母公司Alphabet下设立的人工智能实验室）于2023年12月6日发布的人工智能模型，可同时识别文本、图像、音频、视频和代码五种类型信息，还可以理解并生成主流编程语言（如Python、Java、C++）的高质量代码，并拥有全面的安全性评估。首个版本为Gemini 1.0，包括三个不同体量的模型：用于处理“高度复杂任务”的Gemini Ultra、用于处理多个任务的Gemini Nano和用于处理“终端上设备的特定任务”的Gemini Pro。谷歌AI模型的研发进程从2012年就已开始；2022年8月推出高级语言学习模型PaLM；2023年5月Google I/O大会上Alphabet首席执行官桑达尔·皮查伊发布了PaLM2与Bard，同时宣布Gemini即将问世；12月6日在一段官方公布的视频中，谷歌正式推出Gemini。谷歌计划逐步将Gemini整合到其搜索、广告、Chrome等其他服务中。从2023年12月13日开始，开发者和企业客户可以通过Google的AI Studio和Google Cloud Vertex AI中的Gemini API访问Gemini Pro。2023年12月7日，科技界指出Gemini与ChatGPT测试方法存疑，且分数存在夸大嫌疑，同时发布会演示视频也存在虚假剪辑问题。随后，对于视频“造假”一说，Gemini联合创始人奥里奥尔·维尼亚尔斯予以否认。2024年2月9日，谷歌宣布Gemini Ultra可免费使用，16日发布Gemini 1.5，21日发布开源模型Gemma。Gemma采用了与Gemini相同的技术和基础架构，基于英伟达GPU和谷歌云TPU等硬件平台进行优化，有20亿、70亿两种参数规模。

Bard

公司：谷歌
Bard 是谷歌在大型语言模型基础上推出的聊天机器人。Bard 基于 Google 的对话应用语言模型 LaMDA 的轻量级版本，使用更少的计算能力，使其能够扩展到更多的人，并提供额外的反馈。2023年3月21日，谷歌向公众开放Bard 的访问权限。美国和英国用户可以预约。2023年12月7日，谷歌发布了其最新、最先进的大语言模型 Gemini ，用户将能够在 Google Bard 中体验特别调整的 Gemini Pro 英语版本。

Claude

公司：Anthropic
Claude，美国人工智能初创公司Anthropic发布的大型语言模型家族，拥有高级推理、视觉分析、代码生成、多语言处理、多模态等能力，该模型对标ChatGPT、Gemini等产品。2023年3月15日，Anthropic正式发布Claude的最初版本，并开始不断升级迭代；同年7月，Claude 2正式发布；同年11月，Claude 2.1正式发布；次年3月4日，Claude 3系列正式发布。根据Anthropic官方，Claude 3系列旗舰模型Opus在本科和研究生水平的知识、数学和复杂任务理解方面均超过GPT-4和Gemini 1.0 Ultra。2024年3月6日，亚马逊宣布Anthropic的Claude 3 Sonnet模型现已在亚马逊云科技的Amazon Bedrock正式可用。

硅基知识大模型

公司：深兰科技
硅基知识大模型是深兰科技研发的一款针对垂直领域、特定用户、细分应用场景的、用户可训练的生成式大语言模型。

知海图AI

公司：知乎和面壁科技
知海图AI，是知乎和面壁科技合作发布的中文大模型，于2023年4月13日正式开启内测。

泰坦

公司：亚马逊
泰坦（Titan），是亚马逊推出的大型语言模型。2023年4月13日，亚马逊云服务部门宣布推出自有的大型语言模型泰坦。

WPS AI

公司：金山办公
“WPS AI”是金山办公旗下具备了大语言模型能力的一款生成式人工智能应用，也是中国协同办公赛道首个类ChatGPT式应用。2023年7月6日，金山办公正式推出基于大语言模型的智能办公助手WPS AI，官网同步上线。

Google智能助理

公司：谷歌
Google智能助理是Google开发的智能助理，于2016年5月在Google I/O发布。与Google即时不同，Google智能助理可以参与双向对话。智能助理被集成在Allo应用、Google Home设备、Android 6.0或以上的设备、Pixelbook、Wear OS、Android TV、iOS和Android Auto。

Replika

公司：Luka
Replika是一家名为Luka的公司在2016年就推出了自己的人工智能聊天机器人产品。

LLaMA

公司：Meta
LLaMA，是元宇宙平台公司（Meta）公开发布的产品。2023年7月，Meta公司发布了人工智能模型LLaMA 2的开源商用版本，意味着大模型应用进入了“免费时代”，初创公司也能够以低廉的价格来创建类似ChatGPT这样的聊天机器人。

西湖大模型

公司：西湖心辰（杭州）科技有限公司
2023 年 07 月 09 日，西湖心辰（杭州）科技有限公司正式推出自研的通用大模型——“西湖大模型”。西湖大模型具备长期记忆、情感感知和主动聊天等功能，并且融合了文字、图片、语音等多种模态。

蓝心大模型
公司：vivo
蓝心大模型是vivo发布的自研大模型矩阵。

SoulX
公司：上海任意门
SoulX，是社交平台Soul上线的自研语言大模型。

Copilot

公司：微软
Copilot是微软在Windows 11中加入的AI助手，该AI助手是一个集成了在操作系统中的侧边栏工具，可以帮助用户完成各种任务。Copilot依托于底层大语言模型（LLM），用户只需说几句话，做出指示，它就可以创