国内AI大模型名单--大浪淘沙,谁主沉浮

近年来,人工智能(AI)技术的迅猛发展为企业带来了前所未有的机遇。AI大模型凭借其强大的计算和学习能力,正在各行各业中扮演越来越重要的角色。本文将基于一张详细的生态图,深入探讨中国AI大模型生态系统,并为企业如何利用这些技术实现创新和增长提供一些指导。

大模型从诞生的那一刻开始便与生产和创造紧密联系在一起。人们在为自己的工作是否会被大模型所轻松取代而忧心忡忡的同时,也享受着“自己想点子,AI来执行”带来的生产力解放。究竟是替代还是协同,现在要下定论还为时尚早。但透过以下117家企业的大模型落地情况,或许可以帮助你了解到,AI在B端到底带来了哪些改变。

一 AI大模型117家名单

117家已备案的AI大模型名称、所属公司、主要应用领域。大家赶紧收藏好了!这应该是目前最全面的一个AI大模型清单:

来源:AI大模型前沿


 

二  TOP20家大模型介绍

  1. 百度-文心一言

- 作为科技领域的领军者,百度于2023年3月16日率先推出了其生成式AI产品“文心一言”,正式开启邀测。仅仅数月后的10月,百度又推出了文心一言的最新迭代版本——文心一言4.0。

百度在大模型开发上持续采用创新算法和结构,如Transformer,以优化模型性能和学习效率。"文心一言"是百度开发的高级人工智能语言模型,属于其"文心"系列。它主要应用于机器翻译、内容推荐和对话系统等领域。通过大数据训练,该模型能够精准地理解和生成自然语言,不断优化以适应多样化的应用场景。

2. 商汤科技-日日新

- 2023年4月,商汤科技推出了名为“日日新SenseNova”的大模型。这款大模型集成了自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种强大功能。其中,商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品也备受用户喜爱。目前,商汤已发布了最新版大模型“商量SenseChat 2.0版本”,其参数规模高达千亿级。

现在商汤的AI大装置GPU上线数量已经达到了3万块。商汤发布的新模型InternLM-123B在全球51个知名评测集共计30万个问题集合上测试成绩整体排名全球第二,超过GPT-3.5-turbo以及Meta新发布的LLaMA2-70B。

3. 百川智能-百川

- 百川智能,这家由搜狗创始人王小川创立的创新型企业,自2023年成立以来便以惊人的速度发展。短短半年多时间,百川智能便接连发布了Baichuan-7B/13B、Baichuan2-7B/13B四款开源可免费商用大模型,以及Baichuan-53B、Baichuan2-53B两款闭源大模型,平均每28天就会有一款新的大模型问世。

百川智能在大模型开发上不断追求技术革新,采用如Transformer等先进架构来增强模型性能。"百川大模型"是由百川智能推出的尖端语言模型,旨在提升机器对自然语言的理解和生成能力。该模型结合了最新的深度学习技术,优化了从文本分析到语义理解的各个方面,并且能应用于多个行业如金融、医疗和客户服务中。

4. 智谱AI-智谱清言

- 智谱AI,自2019年成立以来,便深耕于大模型研发领域,作为国内最早一批研发大模型的企业,其背后有着清华大学知识工程实验室(KEG)的强大技术支撑。智谱已经成功发布了多款令人瞩目的大模型产品,如双语千亿级超大规模预训练模型GLM-130B、中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai等,其中还包括CodeGeeX和CogView等创新产品。基于ChatGLM的卓越性能,智谱于2023年推出了面向C端用户的聊天对话应用“智谱清言”。而在B端市场,智谱也凭借卓越的技术实力,与多家国内互联网巨头、政企达成了深度合作。

智谱华章推出的“智谱清言”大模型在自然语言处理领域有着出色的表现,能够提供高效、准确的语音交互体验。该模型应用了深度学习和大数据分析技术,优化了文本处理和语义解析的精度。智谱清言在多个行业,如法律、教育和客户支持中,提供了高效的自动化解决方案。

5. 中科院自动化研究所-紫东太初

 成立于1956年10月的中科院自动化研究所,是中国自动化研究领域的摇篮。该研究所推出的“紫东太初”跨模态通用人工智能平台于2021年正式发布。目前,“紫东太初”的参数已达到千亿级别,支持视觉、文本、语音等多种模态,并基于全栈国产化基础软硬件平台建立。今年6月,紫东太初发布了更加先进的2.0版本,新增了视频、传感信号、3D点云等模态数据。如今,“紫东太初”已在文本创作、医疗、物流、政务等多个行业实现了广泛的应用落地。

6. 抖音-云雀

- 抖音集团(前字节跳动)于2023年8月17日宣布推出AI对话产品“豆包”,这是基于云雀模型开发的全新AI工具。豆包集成了聊天机器人、写作助手以及英语学习助手等多种功能,它能够回答各种问题并与用户进行流畅的对话,帮助人们快速获取信息。

最新的神经网络架构和算法来提升模型的效率和准确性。"豆包"是字节跳动开发的先进的人工智能语言模型,专注于提高文本生成和理解的能力。该模型采用了尖端的深度学习技术,特别优化了对话系统和内容推荐的性能。豆包大模型在提升用户互动体验和内容个性化方面发挥了重要作用。

7. 阿里巴巴-通义千问大模型

通义千问,作为阿里云精心研发的底层通用大模型,旨在成为人们生活和工作中的得力智能助手。自4月正式亮相以来,已迭代至2.0版本,参数规模达到千亿级别,显著提升了其在多领域的应用能力。在云栖大会上,阿里云正式发布通义千问2.0,并在各大手机应用市场同步推出通义千问APP,进一步拓宽了其应用边界。

阿里云在大模型开发中注重技术创新和性能提升,使用先进的算法框架如BERT和GPT。"通义千问"是阿里云推出的大型语言模型,专为理解和生成自然语言而设计。该模型采用了最新的机器学习技术,优化了自然语言处理的深度和广度。它广泛应用于客服自动化、内容生成和数据分析等领域,提升了业务效率和用户体验。

8. 华为-华为云盘古NLP大模型

华为云盘古NLP大模型,作为业界首个超千亿参数的中文预训练模型,傲然立足于华为云盘古系列超大规模预训练模型中。该模型汇聚海量图像、视频数据与盘古独特技术,孕育出视觉基础模型、多模态大模型及预测大模型,实现图像生成、理解、视频生成等多重功能。其融合语言和视觉的跨模态信息,极大提升了多任务处理能力,使得不同任务间具备强大的迁移能力。在4月25日,华为云更是发布了包含30亿参数的全球最大视觉预训练模型和与循环智能、鹏城实验室联合研发的千亿参数、40TB训练数据的全球最大中文语言预训练模型。

9.腾讯-混元

去年9月,腾讯混元大模型横空出世,目前已扩展至万亿参数规模,由7万亿tokens的预训练语料训练而来,能力已覆盖了文本、多模态理解及生成等。

文本生成上,混元率先在国内采用MoE架构,最新升级后的模型性能较上一代提升50%,部分中文能力已追平GPT-4!它的超长文能力也已在腾讯元宝中上线,一次性能够处理长达1000万字的文档,并支持多种格式的文件解析,如PDF、PPTX。它还能基于文档内容生成柱状图、折线图和饼状图等。

腾讯推出的“混元”大模型在语音识别、自然语言处理等领域具有出色的性能,可支持多种应用场景。该模型结合了最新的机器学习技术,如Transformer架构,以提高其处理复杂语言任务的能力。混元大模型广泛应用于聊天机器人、内容推荐系统以及自动翻译等领域,极大地优化了用户交互体验。

10.昆仑万维的“天工”大模型

作为国内首个与ChatGPT相媲美的双千亿级大语言模型,以对话式AI助手的形象出现。天工以自然语言为媒介,与用户展开深入的问答交流,其AI生成能力堪称全面,不仅涵盖文案创作、知识问答,更在逻辑推演、数理推算、代码编程等方面展现出卓越的能力。支持万字以上的文本对话,能够实现超过20轮次的用户交互,无论是学习、职场还是生活场景,天工都能为用户提供出色的问答体验。

天工AI“昆仑万维”大模型是中国首个对标ChatGPT的双千亿级大语言模型,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。该模型利用尖端的人工智能技术,特别优化了对复杂文本和多语种数据的处理能力,在金融分析、智能客服以及多媒体内容生成等多个行业中展现了出色的应用效果。

11. 科大讯飞-星火认知大模型

科大讯飞倾力打造的星火认知大模型,作为新一代的认知智能典范,展现了跨领域的知识和语言理解能力。它能够以自然对话的方式理解并执行任务,集语言理解、知识问答、逻辑推理、数学解答、代码理解与编写等多重能力于一身。

科大讯飞在语音识别和自然语言处理领域有深厚的技术积累,其星火大模型在语音交互和智能问答等方面具有显著优势。"星火大模型" 是科大讯飞开发的高级语言处理模型,专门设计用于深入理解和生成自然语言。该模型利用最新的人工智能技术,提升了语音识别和语言理解的准确性。星火大模型广泛应用于教育、医疗和客户服务等行业,改善了交互体验和工作效率。

12. 三六零-360智脑大模型

360智脑大模型,作为360集团研发的认知型通用大模型,最新版本“360智脑4.0”已全面融入集团各类产品。它不仅提供卓越的文本生成和创作服务,支持文本或图片输入生成高质量、多风格的图像,更拥有强大的智能编辑功能,无损放大、智能消除、智能抠图等操作一应具备,助您轻松创作精彩图像。

13. 上海人工智能实验室-书生

- 上海人工智能实验室,作为该领域的佼佼者,其推出的“书生”项目展现了其在人工智能领域的深厚实力和创新精神。具体细节和产品优势因文本中未提及,故在此保持留白,以待未来更多精彩内容的揭晓。自2021年问世以来,“书生”(INTERN)大模型历经数次蜕变,从国内首个横跨多种视觉任务的通用大模型,逐步蜕变为一个融合视觉、语言和三维等多维元素的大模型体系。除了书生·天际的璀璨亮相,书生还精心打造了书生·多模态、书生·浦语等,更为业界呈现了一个完整的、面向大模型研发与应用的开源生态链。

14. 华为-智慧助手(小艺)大模型

华为智慧助手小艺升级版,根植于华为盘古L0基座大模型,针对终端消费者场景进行了深度优化。在华为开发者大会上,这款全新版本的小艺以其更加聪明、能干和贴心的特性赢得了广泛赞誉。如今的小艺能够提供更智能的交互体验,如根据用户需求自动生成文案等内容。

小艺大模型带来的功能远不止于此,官方介绍称,它搭载了大模型能力,能够完成更为复杂的任务。在众测期间,用户可以体验到文案辅助创作能力、资讯快速摘要以及对话式问答等功能,极大地提升了手机的智能化水平。而用户还可以通过询问“你可以干什么”等方式,挖掘出更多的使用技巧和玩法,实现个性化的智能助手服务。

不仅如此,这次更新还新增了电影票预订和商圈服务查询等功能,优化了时区、万年历等知识类查询体验。这些改进不仅使智能助手的功能更加丰富多样,也让用户在日常生活中享受到了更便捷的服务。

15. 出门问问-序列猴子

出门问问近期发布的自研大型语言模型「序列猴子」,在“AGI·降临”2023 AIGC战略发布会上闪亮登场。这款大模型专注于服务B端企业,为企业提供专属的模型服务。序列猴子以其支持智能多轮对话的特质,帮助提高对话管理和调度能力,快速响应用户反馈和需求,实现对话的高效率和精准度。作为一款超大规模语言模型,序列猴子凭借其长序列、多模态、单模型、大数据等特点,在问答系统、自然语言处理、机器翻译、文本摘要等领域展现出广泛的应用潜力。基于其强大的表示与推理能力,序列猴子支持多轮交互,显著提高了生产效率和数据处理能力。月之暗面 (Moonshot AI) 诞生于2023年3月,它矢志不渝地探寻能源与智能的交融之道,力求达到转化的极致。仅仅在短短数月后,它就携带着其全球首创、支持输入高达20万汉字的智能助手产品Kimi,于2023年10月惊艳亮相。其创始团队由众多科技巨擘的核心成员组成,他们曾深度参与Google Gemini、Google Bard、盘古NLP、悟道等卓越大模型的研发,多项技术精髓亦被Google PaLM、Meta LLaMa、Stable Diffusion等业界翘楚采纳。

16. 月之暗面 kimi

月之暗面的Kimi大模型是一款由北京月之暗面科技有限公司推出的智能助手,旨在提供全面的信息处理和知识支持。Kimi能迅速理解用户问题,给予精准回应。也是首个支持20万汉字输入,现提升至200万字,提供丰富上下文处理。月之暗面 (Moonshot AI) 诞生于2023年3月,它矢志不渝地探寻能源与智能的交融之道,力求达到转化的极致。仅仅在短短数月后,它就携带着其全球首创、支持输入高达20万汉字的智能助手产品Kimi,于2023年10月惊艳亮相。其创始团队由众多科技巨擘的核心成员组成,他们曾深度参与Google Gemini、Google Bard、盘古NLP、悟道等卓越大模型的研发,多项技术精髓亦被Google PaLM、Meta LLaMa、Stable Diffusion等业界翘楚采纳。

"Kimi"是月之暗面公司开发的先进人工智能语言模型,旨在提升机器对自然语言的理解和生成能力。该模型结合了深度学习和大数据分析技术,优化了文本处理、情感分析和语义理解的性能。Kimi大模型在自动内容生成、情感分析和用户交互等领域表现出色,提升了业务效率和用户体验。

17.WPS AI

北京金山软件有限公司倾力打造的WPS AI,是一款集成在WPS Office套件中的人工智能应用。它以其卓越的大语言模型能力,为用户提供更智能、高效的文档处理解决方案。智能文档写作、阅读理解和问答、智能人机交互等功能一应俱全,全方位提升用户在办公、写作、文档处理等方面的体验。WPS AI与WPS其他产品无缝对接,为用户带来一个统一的AI增强型办公平台。不仅如此,WPS AI更是内容创作的得力助手,让用户轻松节省时间与精力。通过WPS AI,用户可以轻松改进、调整内容,尽情享受AI带来的种种便利。

18.360科技

北京奇虎360科技有限公司近日发布了自研的奇元大模型,这一大型模型的成功推出,再次彰显了360在科技领域的深厚实力。奇元大模型已于11月4日通过备案,360公司也因此成为国内首家拥有两个大模型(包括先前的360智脑大模型)均通过备案的科技企业。奇元大模型主要面向B端用户,商业化应用前景广阔。其技术优势源于360在人工智能领域的长期耕耘,而数据优势则得益于搜索所拥有的大规模、多样性和高质量训练语料。这些优势使得奇元大模型在生成创作、多轮对话、逻辑推理等核心能力方面表现出色,能够覆盖大模型的全部应用场景。

19、面壁智能

面壁智能精心打造的面壁露卡LUCA,是一款千亿级别的多模态大模型,于2023年8月28日在“通用人工智能算力论坛”(AGICF)上正式发布。这款大模型以CPM-Bee为基础,对标ChatGPT的多模态智能对话助手。早在5月27日的2023数博会上,面壁露卡LUCA 1.0版本就以其卓越的语言模型能力首次亮相。LUCA凭借先进的自然语言处理技术,能够轻松实现智能多轮对话,极大地提高了对话管理和调度的效率和精准度。它在问答系统、自然语言处理、机器翻译、文本摘要等领域都有着广泛的应用。

20、出门问问-序列猴子

出门问问近期发布的自研大型语言模型「序列猴子」,在“AGI·降临”2023 AIGC战略发布会上闪亮登场。这款大模型专注于服务B端企业,为企业提供专属的模型服务。序列猴子以其支持智能多轮对话的特质,帮助提高对话管理和调度能力,快速响应用户反馈和需求,实现对话的高效率和精准度。作为一款超大规模语言模型,序列猴子凭借其长序列、多模态、单模型、大数据等特点,在问答系统、自然语言处理、机器翻译、文本摘要等领域展现出广泛的应用潜力。基于其强大的表示与推理能力,序列猴子支持多轮交互,显著提高了生产效率和数据处理能力。

三、总结

面对全球AI大模型的百舸争流现状,中国AI产业亟需进行深刻反思并寻找破局之道。首要任务是回归商业本质,摒弃单纯追求技术参数竞赛的浮躁心态,更加注重市场需求导向的研发与应用创新。企业应聚焦特定垂直领域,深度挖掘行业痛点,打造真正解决实际问题、创造用户价值的产品与解决方案。

其次,提升底层技术创新能力至关重要。中国AI企业应加大在基础理论、核心算法以及关键软硬件领域的研发投入,力争在核心技术上取得突破,打破对国外技术的依赖,形成差异化竞争优势。同时,鼓励产学研深度融合,通过与高校、科研院所的合作,推动前沿研究成果的高效转化。

此外,中国AI企业必须加速国际化进程,提升全球竞争力。这意味着不仅要积极拓展海外市场,建立全球化的销售与服务网络,还要积极参与国际标准制定,提升国际话语权;引进海外高端人才,构建多元化的全球研发团队;加强与国际企业的战略合作,共享全球创新资源。

总的来说,中国AI产业在商业化、创新力与国际化等方面存在的短板。唯有痛定思痛,回归商业本质,强化底层创新,加速国际化步伐,方能在未来的全球AI竞争中重新找回属于自己的位置。这一转变的过程虽充满挑战,但对于志在引领全球AI浪潮的中国而言,却是通往真正崛起的必由之路。

参考:AI大模型前沿


推荐书籍:
《分布式商业生态战略:数字商业新逻辑与企业数字化转型新策略》

作者:思二勋
书籍介绍:
本书从新时代商业环境出发,如:元宇宙、Web 3.0、资产数字化、反垄断、要素市场化配置、分布式自治组织(distributed autonomous organization,DAO)、非同质化通证(non-fungible token,NFT)等新市场和新趋势出发,以企业数字化转型为核心,以区块链等数字化技术为基本点,以场景为基本面,勾勒了数字化时代分布式商业演化的新趋势,以及其对企业经营管理的影响,提出了数字化时代企业数字化转型的新策略和分布式经营管理的低成本、高效率发展方案。

分布式商业是数字经济时代的基本商业形态,分布式商业生态战略也是企业数字化生存与发展的基本战略,是企业数字化转型的全新模式和路径,亦是元宇宙商业生态建设的新范式。

  • 6
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值