【首发评测】国产大模型真落地，我用这5个问题为难了它们，结果你意想不到...-CSDN博客

本文链接：https://blog.csdn.net/mcil9g4065q/article/details/132644485

国家批准11家公司的大模型产品，如百度、商汤、MINIMAX等，标志着国产大模型进入公众服务阶段，政策规范推动行业发展。各企业如百度的文心一言展示了功能特性，如搜索集成和插件，商汤的商量具备专业分析能力，但不同模型在性能和限制上有所差异。

摘要由CSDN通过智能技术生成

出品 | 网易科技《智见焦点》

作者 | 赵芙瑶

编辑 | 丁广胜

大模型的风暴席卷全球，然而对于普通C端用户来说，国产大模型的内测邀请码却总是“一码难求”，即使开放申请体验，排队时长也难以预估。

然而就在今日，备受行业瞩目的首批大模型产品获批名单来了，当中既有百度、字节跳动、腾讯、华为、商汤等大型企业，也包含了具有科研院校背景的智谱AI、中科院等，同时创业公司百川智能、MINIMAX等也位列其中。

也就是说，国产大模型人人可用的时代已经到来。

2022年12月，国家网信办、工信部、公安部联合出台了《互联网信息服务深度合成管理规定》，对深度合成技术作出规范，并规定从2023年1月10日起实施。2023年7月，国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》，希望促进生成式人工智能健康发展和规范应用。国内生成式AI的发展也紧跟政策步伐，此次11家公司首批通过《生成式人工智能服务管理暂行办法》备案，可正式上线面向公众提供服务，无疑意味着市场格局的又一次生变。

Open AI之所以强势出圈，与其强大的数据集不无关系。曾几何时，对于许多国产大模型来说，中文语料库短缺的痛点一直存在。此前大模型也并未全面开放，中文数据无法像ChatGPT那样进行“几何级”的积累。

AI时代“百舸争流”，哪家大模型最先拿到了开放的名额，就相当于拿到了最先积累中文数据、占领市场份额的“船票”。

那么，这些大模型的水平究竟如何？网易科技就以下近期热点话题，对首批已开放的部分大模型展开了评测。

百度-文心大模型-文心一言

嵌入搜索引擎、插件可生成表格

文心一言是知识增强的大语言模型，2023年3月27日上线， 6月开放3.5版本内测。百度作为国内率先入场大模型的企业之一，李彦宏对于文心一言寄予厚望。从文心一言的回答来看，比较言简意赅，虽然并未进行强观点的输出，但是答案相对中规中矩。

此前ChatGPT的插件集十分火爆，此次令人惊喜的是，文心一言也更新了插件功能！包括览卷文档、E言易图以及说图解画。

近期正值财报季，上市企业们纷纷发布二季报，以折线图、柱状图的形式展现财务数据会更加一目了然。输入财报数据，并选中E言易图插件，就会生成柱状图，然而美中不足的是，E言易图并不能明白“在柱状图上标明数据”的指令。

至于“说图解画”插件，文心一言不知为何忽然建议使用英文进一步提问，或许是使用了英文数据集的缘故。

不过可圈可点的是，百度将文心一言的对话能力嵌入了搜索引擎，与New Bing类似，可以面向更多的用户群体，文心一言客户端也已经在App store上线。

商汤科技-日日新大模型-商量

To B To C 两手抓

日日新（SenseNova），是商汤科技宣布推出的大模型体系，包括自然语言处理模型“商量”（SenseChat）、文生图模型“秒画”和数字人视频生成平台“如影”（SenseAvatar）等。

从商量·SenseChat的回答来看，回答连贯、逻辑流畅、较为专业、篇幅较长，并且有一些有价值的观点。更令人惊喜的是，其拥有“辩证思维”。例如给出蔚来造手机以及小米造车的分析时，商量能发现二者之间的异曲同工之处。

点击查看商量的回答

从其它回答来看，商量在回答问题时都会联网查询相关信息。但日日新的To B应用还暂未向公众开放，目前只能联系商务进行试用。

MINIMAX-ABAB大模型

有限速、不可输入过长文本

ABAB大模型，是Minimax推出的自研通用大模型。令人费解的是，其开放平台在当前阶段，体验用户（未充值）调用接口时会被限速，所以其生成答案的速度为所有大模型中最为缓慢，并且输入字符也有限制，所以只能将每个问题单独提问一遍。其页面UI设计让信息浏览也略有不便，不过生成的答案倒是没什么毛病。