新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析

本文深入分析了国内AI大模型的最新进展,重点介绍了商汤、百度、阿里、华为、腾讯等主要厂商的AI大模型架构及应用场景。商汤的SenseCore和日日新体系、百度的AI大底座与文心大模型、阿里的M6-OFA和通义系列、华为的ModelArts与盘古大模型、腾讯的HCC高性能计算集群和混元大模型,都在推动大模型在各领域的应用。文章强调了厂商的全栈能力、商业基础、产品市场竞争力和生态开放性的重要性。
摘要由CSDN通过智能技术生成

参考国内主流AI 大模型架构及应用场景深度分析 2024

1 厂商总览

在这里插入图片描述

1.1 国外

(1)Open AI:GPT-4【美国旧金山的人工智能研究公司】
GPT-4于2023年3月14日发布,是千亿级参数的多模态预训练模型,能够支持图像和文本的输入。
(2)Anthropic(人类的):Claude【美国人工智能初创公司】
Claude于2023年3月14日发布,是Anthropic开发的类似ChatGPT的聊天机器人,使用的是constitutional(宪法的)AI的偏好模型。
(3)Google:PaLM-E【美国的跨国科技企业】
PaLM-E于2023年3月10日发布,是一种多模态视觉语言模型(VLM),具有5620亿个参数,集成了可控制机器人的视觉和语言能力。
(4)Naver:HyperCLOVA【韩国最大门户网站】
与三星电子合作,于2021年5月发布,超过2000亿个参数的超大规模模型;97%使用的是韩文语料,计划23H1基于大模型推出Search GPT。
(5)Kakao:KoGPT【韩国互联网巨头】
于2021年发布,专注于开发基于AI的图像创建技术和医疗保健技术。
(6)LG:Exaone【韩国第四大财团LG集团】
于2022年12月发布,拥有3000亿参数,使用图像和文本数据的多模态模型,是目前韩国参数规模最大的模型,用于生物医药和智能制造行业。
(7)Meta:SAM、LLaMA【美国加利福尼亚州原名Facebook】
视觉模型SAM:于2023年4月发布,通过精细标注,识别分割画面上的指定物体。
大语言模型LLaMA:于2023年2月发布,包括4种参数规模。

1.2 国内

在这里插入图片描述

2 评价门槛

本次评估模型设立“中国市场落地”“全栈能力”“商业基础”、“产品市场”、四项基线,同时满足这四项基线要求的大模型厂商,将入围竞争力评估。
在这里插入图片描述

(1)中国市场落地:截止目前,海外大模型厂商尚未在中国落地,其产品服务和生态圈打造等关键能力在中国市场均有缺失,而非官方渠道使用相关服务的企业将面临高风险。例如,OpenAI尚未向中国用户开放ChatGPT及GPT-4服务,类似的情况同样出现在谷歌、Meta等大模型厂商提供的相应服务上。相较而言,接入国产及自主研发的大模型更加现实、稳定且具有可控性。

(2)全栈能力:大模型服务考核厂商从算力基础设施、深度学习框架到算法设计优化的全栈大模型解决方案能力,以及相应的工程化和运营经验与水平。因此,入围的厂商应具备相关全栈能力,如应有自建且自运营的算力基础设施、领先的算法设计等能力。

(3)商业基础:大模型厂商在技术层保持投入的同时,还应拥有大模型商业输出能力的积累,将大模型技

  • 9
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

皮皮冰燃

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值