本文分享了目前国内最新的、完整的AI大模型清单及介绍!
1 AI大模型117家名单
117家已备案的AI大模型名称、所属公司、主要应用领域。大家赶紧收藏好了!这应该是目前最全面的一个AI大模型清单:
2 TOP20家大模型介绍
- 百度-文心一言
- 作为科技领域的领军者,百度于2023年3月16日率先推出了其生成式AI产品“文心一言”,正式开启邀测。仅仅数月后的10月,百度又推出了文心一言的最新迭代版本——文心一言4.0。紧接着,11月1日,百度上线了文心一言专业版,其定价策略也相当亲民,单月购买仅需59.9元/月,连续包月更享优惠价49.9元/月。此前广受欢迎的文心一言基础版,则依然保持免费使用的策略。百度CEO李彦宏对文心大模型4.0赞不绝口,他表示这是百度迄今为止最强大的文心大模型,不仅实现了基础模型的全面升级,其综合能力更是“与GPT-4相比毫不逊色”。
2. 智谱AI-智谱清言
- 智谱AI,自2019年成立以来,便深耕于大模型研发领域,作为国内最早一批研发大模型的企业,其背后有着清华大学知识工程实验室(KEG)的强大技术支撑。智谱已经成功发布了多款令人瞩目的大模型产品,如双语千亿级超大规模预训练模型GLM-130B、中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai等,其中还包括CodeGeeX和CogView等创新产品。基于ChatGLM的卓越性能,智谱于2023年推出了面向C端用户的聊天对话应用“智谱清言”。而在B端市场,智谱也凭借卓越的技术实力,与多家国内互联网巨头、政企达成了深度合作。
3. 抖音-云雀
- 抖音集团(前字节跳动)于2023年8月17日宣布推出AI对话产品“豆包”,这是基于云雀模型开发的全新AI工具。豆包集成了聊天机器人、写作助手以及英语学习助手等多种功能,它能够回答各种问题并与用户进行流畅的对话,帮助人们快速获取信息。该产品支持网页Web平台、iOS以及安卓平台,不过iOS用户需要通过TestFlight进行安装。
4. 百川智能-百川
- 百川智能,这家由搜狗创始人王小川创立的创新型企业,自2023年成立以来便以惊人的速度发展。短短半年多时间,百川智能便接连发布了Baichuan-7B/13B、Baichuan2-7B/13B四款开源可免费商用大模型,以及Baichuan-53B、Baichuan2-53B两款闭源大模型,平均每28天就会有一款新的大模型问世。百川智能透露,Baichuan-7B/13B两款开源大模型在多个权威评测榜单上均名列前茅,累计下载量已超过六百万次。而Baichuan2-13B更是在MMLU、CMMLU、MedQA、USMLE等几大权威评估基准中领先LLaMA2。
5. 中科院自动化研究所-紫东太初
- 成立于1956年10月的中科院自动化研究所,是中国自动化研究领域的摇篮。该研究所推出的“紫东太初”跨模态通用人工智能平台于2021年正式发布。目前,“紫东太初”的参数已达到千亿级别,支持视觉、文本、语音等多种模态,并基于全栈国产化基础软硬件平台建立。今年6月,紫东太初发布了更加先进的2.0版本,新增了视频、传感信号、3D点云等模态数据。如今,“紫东太初”已在文本创作、医疗、物流、政务等多个行业实现了广泛的应用落地。
6. Minimax-ABAB
- Minimax凭借自研实力,推出了包含文本到视觉(text-to-visual)、文本到语音(text-to-audio)、文本到文本(text-to-text)三个模态的基础模型架构,并成功推出了自研通用大模型“ABAB”。
7. 商汤科技-日日新
- 2023年4月,商汤科技推出了名为“日日新SenseNova”的大模型。这款大模型集成了自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种强大功能。其中,商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品也备受用户喜爱。目前,商汤已发布了最新版大模型“商量SenseChat 2.0版本”,其参数规模高达千亿级。
8. 上海人工智能实验室-书生
- 上海人工智能实验室,作为该领域的佼佼者,其推出的“书生”项目展现了其在人工智能领域的深厚实力和创新精神。具体细节和产品优势因文本中未提及,故在此保持留白,以待未来更多精彩内容的揭晓。自2021年问世以来,“书生”(INTERN)大模型历经数次蜕变,从国内首个横跨多种视觉任务的通用大模型,逐步蜕变为一个融合视觉、语言和三维等多维元素的大模型体系。除了书生·天际的璀璨亮相,书生还精心打造了书生·多模态、书生·浦语等,更为业界呈现了一个完整的、面向大模型研发与应用的开源生态链。
9. 科大讯飞-星火认知大模型
科大讯飞倾力打造的星火认知大模型,作为新一代的认知智能典范,展现了跨领域的知识和语言理解能力。它能够以自然对话的方式理解并执行任务,集语言理解、知识问答、逻辑推理、数学解答、代码理解与编写等多重能力于一身。
10. 三六零-360智脑大模型
360智脑大模型,作为360集团研发的认知型通用大模型,最新版本“360智脑4.0”已全面融入集团各类产品。它不仅提供卓越的文本生成和创作服务,支持文本或图片输入生成高质量、多风格的图像,更拥有强大的智能编辑功能,无损放大、智能消除、智能抠图等操作一应具备,助您轻松创作精彩图像。
11. 阿里巴巴-通义千问大模型
通义千问,作为阿里云精心研发的底层通用大模型,旨在成为人们生活和工作中的得力智能助手。自4月正式亮相以来,已迭代至2.0版本,参数规模达到千亿级别,显著提升了其在多领域的应用能力。在云栖大会上,阿里云正式发布通义千问2.0,并在各大手机应用市场同步推出通义千问APP,进一步拓宽了其应用边界。
12. 腾讯-腾讯混元助手大模型
腾讯混元大模型(Tencent Hunyuan),由腾讯团队倾力打造,展现了强大的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力。
13. 华为-华为云盘古NLP大模型
华为云盘古NLP大模型,作为业界首个超千亿参数的中文预训练模型,傲然立足于华为云盘古系列超大规模预训练模型中。该模型汇聚海量图像、视频数据与盘古独特技术,孕育出视觉基础模型、多模态大模型及预测大模型,实现图像生成、理解、视频生成等多重功能。其融合语言和视觉的跨模态信息,极大提升了多任务处理能力,使得不同任务间具备强大的迁移能力。在4月25日,华为云更是发布了包含30亿参数的全球最大视觉预训练模型和与循环智能、鹏城实验室联合研发的千亿参数、40TB训练数据的全球最大中文语言预训练模型。
14. 华为-智慧助手(小艺)大模型
华为智慧助手小艺升级版,根植于华为盘古L0基座大模型,针对终端消费者场景进行了深度优化。在华为开发者大会上,这款全新版本的小艺以其更加聪明、能干和贴心的特性赢得了广泛赞誉。如今的小艺能够提供更智能的交互体验,如根据用户需求自动生成文案等内容。
15. 出门问问-序列猴子
出门问问近期发布的自研大型语言模型「序列猴子」,在“AGI·降临”2023 AIGC战略发布会上闪亮登场。这款大模型专注于服务B端企业,为企业提供专属的模型服务。序列猴子以其支持智能多轮对话的特质,帮助提高对话管理和调度能力,快速响应用户反馈和需求,实现对话的高效率和精准度。作为一款超大规模语言模型,序列猴子凭借其长序列、多模态、单模型、大数据等特点,在问答系统、自然语言处理、机器翻译、文本摘要等领域展现出广泛的应用潜力。基于其强大的表示与推理能力,序列猴子支持多轮交互,显著提高了生产效率和数据处理能力。月之暗面 (Moonshot AI) 诞生于2023年3月,它矢志不渝地探寻能源与智能的交融之道,力求达到转化的极致。仅仅在短短数月后,它就携带着其全球首创、支持输入高达20万汉字的智能助手产品Kimi,于2023年10月惊艳亮相。其创始团队由众多科技巨擘的核心成员组成,他们曾深度参与Google Gemini、Google Bard、盘古NLP、悟道等卓越大模型的研发,多项技术精髓亦被Google PaLM、Meta LLaMa、Stable Diffusion等业界翘楚采纳。
16.昆仑万维的“天工”大模型
作为国内首个与ChatGPT相媲美的双千亿级大语言模型,以对话式AI助手的形象出现。天工以自然语言为媒介,与用户展开深入的问答交流,其AI生成能力堪称全面,不仅涵盖文案创作、知识问答,更在逻辑推演、数理推算、代码编程等方面展现出卓越的能力。支持万字以上的文本对话,能够实现超过20轮次的用户交互,无论是学习、职场还是生活场景,天工都能为用户提供出色的问答体验。
17.WPS AI
北京金山软件有限公司倾力打造的WPS AI,是一款集成在WPS Office套件中的人工智能应用。它以其卓越的大语言模型能力,为用户提供更智能、高效的文档处理解决方案。智能文档写作、阅读理解和问答、智能人机交互等功能一应俱全,全方位提升用户在办公、写作、文档处理等方面的体验。WPS AI与WPS其他产品无缝对接,为用户带来一个统一的AI增强型办公平台。不仅如此,WPS AI更是内容创作的得力助手,让用户轻松节省时间与精力。通过WPS AI,用户可以轻松改进、调整内容,尽情享受AI带来的种种便利。
18.360科技
北京奇虎360科技有限公司近日发布了自研的奇元大模型,这一大型模型的成功推出,再次彰显了360在科技领域的深厚实力。奇元大模型已于11月4日通过备案,360公司也因此成为国内首家拥有两个大模型(包括先前的360智脑大模型)均通过备案的科技企业。奇元大模型主要面向B端用户,商业化应用前景广阔。其技术优势源于360在人工智能领域的长期耕耘,而数据优势则得益于搜索所拥有的大规模、多样性和高质量训练语料。这些优势使得奇元大模型在生成创作、多轮对话、逻辑推理等核心能力方面表现出色,能够覆盖大模型的全部应用场景。
19.面壁智能
面壁智能精心打造的面壁露卡LUCA,是一款千亿级别的多模态大模型,于2023年8月28日在“通用人工智能算力论坛”(AGICF)上正式发布。这款大模型以CPM-Bee为基础,对标ChatGPT的多模态智能对话助手。早在5月27日的2023数博会上,面壁露卡LUCA 1.0版本就以其卓越的语言模型能力首次亮相。LUCA凭借先进的自然语言处理技术,能够轻松实现智能多轮对话,极大地提高了对话管理和调度的效率和精准度。它在问答系统、自然语言处理、机器翻译、文本摘要等领域都有着广泛的应用。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。