深度解析：ChatGPT全面测评——功能、性能与用户体验全景剖析

kkai人工智能

已于 2024-06-08 17:57:40 修改

阅读量1.5k

点赞数 13

文章标签： chatgpt 人工智能学习媒体 ai

于 2024-06-08 17:16:09 首次发布

本文链接：https://blog.csdn.net/qq_22717943/article/details/139548810

版权

从去年底至今，由 OpenAI 发布的大规模语言模型 ChatGPT 引发了几乎所有科技领域从业者的高度关注。据瑞银集团的报告显示，自 2023 年 1 月起，仅两个月内，ChatGPT 的月活用户数便超过了 1 亿。

ChatGPT 被誉为“最强 AI”，这归功于其展示出的近似于人类的思考与回答模式，明显增强了对不同情境的适应能力。这种“更接近人类的思考方式”标志着 AI 语言模型的发展由量变走向了质变。

此外，ChatGPT 的火爆也带动了 AI 概念股的上涨，并促使业界重新评估了 AI 行业的巨大发展潜力。接着，搜索引擎市场也掀起了一场大战，谷歌 CEO Sundar Pichai 在官方博客上宣布推出谷歌的新一代 AI 对话系统 Bard 来应对 ChatGPT；同时，百度宣布将推出其类似 ChatGPT 的产品——文心一言（ERNIE Bot），计划在三月份对外开放测试；微软也更新了自家搜索引擎 Bing，该版本的底层 AI 技术正是 ChatGPT，还为 Edge 浏览器增添了新的 AI 增强功能，承诺将带来前所未有的网络浏览和在线信息检索体验。

为了全方位多维度评估 ChatGPT 的能力，InfoQ 测评室参照了中国信息通信研究院与中国人工智能产业发展联盟的相关标准和评估方法，从功能、性能、用户体验等多个方面对 ChatGPT 进行了评估。让我们一起看看这款应用是否真如传说中那么强大。

**第一部分：基础功能验证**

**自然语言输入**

在中文、俄语、日语、英语以及网络用语的识别测试中，ChatGPT 表现出了较好的上下文联系能力。

结论：ChatGPT 能够理解用户前后文的问题与补充，整个交互过程较为流畅。但在对网络用语、口语或省略关键成分的句子的理解上，可能不如预期。

**机器语言输入**

通过基础编程题目“鸡兔同笼”，测试 ChatGPT 在不同编程语言间的切换及代码格式、逻辑、注释的能力。

结论：高峰时段测试可能出现识别错误，非高峰时段代码通常准确可运行。只要对问题理解正确，生成的代码基本可行。对于未明确表达需求的句子，ChatGPT 也能很好理解。

**第二部分：基础性能测试**

**百科检索**

结论：对常规检索问题，ChatGPT 能给出较全面的答案。作为对话伙伴时，其表现优于拟人化对话。

**数学问答**