软件工程实践——软件评测作业

最新推荐文章于 2024-09-30 18:49:50 发布

OZLIINEX

最新推荐文章于 2024-09-30 18:49:50 发布

阅读量1k

点赞数 29

文章标签：软件工程

本文链接：https://blog.csdn.net/ozline/article/details/137842281

版权

这个作业属于哪个课程	2302软件工程社区
这个作业要求在哪里	软件工程实践-软件评测作业
这个作业的目标	评测现有网站
其他参考文献	构建之法

第一部分：调研、评测

kimi

使用体验

网站：https://kimi.moonshot.cn/

Kimi Chat是月之暗面科技推出的智能聊天机器人APP。它拥有大容量知识库,可以进行智能闲聊、解答问题、提供生活助手服务等,具有极高的智能交互能力。用户可以随时随地与Kimi聊天寻找乐趣,它的回复丰富多样,使聊天更加有趣。 Kimi Chat完全免费,可以通过扫码或在手机上搜索直接使用。

界面首先非常的简洁有力，参考了部分 OpenAI-ChatGPT 的页面，直观告诉用户这个产品是做什么的

这个产品支持接入互联网，同时支持文件上传等功能

我们可以直接要求其进行论文分析

使用效果非常直接，使用 MD 格式输出这篇论文的分析，在结尾还有复制、再试一次和分享的功能

但是功能十分的有限，没有针对个人用户提供针对性的产品

（2）优缺点可以总结为如下

优点：

UI 界面简洁大方有力，突出了重点功能，用户使用门槛低
支持联网搜索、文件解析等实用功能
可以设置常用语，针对个人定制自己的 AI 助手

缺点：

界面功能单一，没有类似于 OpenAI-ChatGPT 的应用插件商店功能，商业化程度地

（3）改进意见

建议针对个人提供一些个性化功能，例如：历史记录拓展、我的收藏、发现（发现其他人的问答）等，也可以支持一定的商业化功能

（4）用户采访

对象背景：高校老师
选择原因：该 AI 侧重于学术圈
对象需求：可以满足快速的阅读论文文献，提供核心文本描述
问题：无
亮点：支持 pdf 上传，界面非常简洁，提供的文档阅读结果具有实用性
建议：增加更多个性功能

BUG 描述

BUG 严重程度	程度说明
五星级	致命错误，对系统功能有严重程度的影响，严重影响安全，极其影响用户使用
四星级	严重错误，对系统功能有很大程度的影响，影响安全性，非常影响用户使用
三星级	一般错误，对系统功能有一般程度的影响，不影响安全性，比较影响用户使用
二星级	界面问题，对系统功能有较小的影响，不影响安全性，稍微影响用户使用
一星级	建议型问题，对系统功能几乎没有什么影响，不影响安全性，也不影响用户使用

测试环境

macOS14.4 + Chrome

可复现性及具体复现步骤

可复现性：必然发生

复现步骤

删除历史会话至只剩一条记录
删除当前会话
当前会话页面仍保留，且页面处于卡顿状态，按钮点按没有反应，需要刷新才可使用

跳出确认框后会话仍然保留，且页面卡死

（4）BUG 分析

可能成因：前端页面逻辑失效，没有正确的跳转回首页，仍然在会话详情页
严重性：二星级（轻微级别）
- 系统功能：页面会卡死，影响系统功能
- 安全性：不涉及安全性
- 用户体验：用户体验下降，无法正常操作页面
改进建议：检查前端页面跳转逻辑

结论

c) 一般

这款 AI 助手目前广告较多，比较热门，以简洁和学术性为优势

类别	描述	评分（满分 10 分, 良好 6 分, 及格 4 分，聊胜于无 1 分, 很差 -3 分）
核心功能	分析三个核心功能，功能设计和质量。	7
细节	有什么为用户考虑的细节?	6
用户体验	当用户完成功能时，不干扰用户 (例如: 是否不断弹出不相关广告)。	8
辅助功能	一些辅助功能如皮肤等	4
差异化功能	这个软件独特的功能. 它对用户的吸引力有多大?	4
软件的效能	占用内存, 启动速度, 内存泄漏情况	8
软件的适应性	在联网/断网, 大小屏幕, 没有鼠标的情况下都可以顺畅操作. 和不同平台的软件能流畅协作	8
成长性	记住用户的选择, 适应用户的特点，用户越用越方便	8
用户有控制权	系统状态有反馈，等待时间要合适。关键操作有确认提示，有明确的错误信息。让用户方便地从错误中恢复工作, 快捷操作键可调整。	8
博客质量	审核筛选垃圾信息博客，博客对用户是否有帮助。	6
总分		75

文心一言

文心一言*（英文名：ERNIE Bot）*是百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动、回答问题、协助创作，高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习，得到预训练大模型，在此基础上采用有监督精调、人类反馈强化学习、提示等技术，具备知识增强、检索增强和对话增强的技术优势。

使用体验

相较于 kimiai，文心一言的商业化明显多了很多

（2）优缺点分析

优点：

文心一言是国内 LLM 模型做的最好的，在知识储备、逻辑分析部分成绩优异
文心一言的商业化做的很成功，个人功能丰富

缺点：

文心一言的理解能力不如 OpenAI 的 ChatGPT3.5
文心一言有抄袭 OpenAI 的部分，例如把模型叫做文心大模型 3.5

（3）改进意见

规避部分抄袭色彩的内容
继续训练提升模型能力

（4）用户采访

对象背景：高校教师
选择原因：对人工智能有一定研究
对象需求：可以简单协助处理日常办公内容
问题：无
亮点：中国制造，回答很全面
建议：在学术领域上不如 kimiai，其应该专注一部分内容

BUG描述

BUG 严重程度	程度说明
五星级	致命错误，对系统功能有严重程度的影响，严重影响安全，极其影响用户使用
四星级	严重错误，对系统功能有很大程度的影响，影响安全性，非常影响用户使用
三星级	一般错误，对系统功能有一般程度的影响，不影响安全性，比较影响用户使用
二星级	界面问题，对系统功能有较小的影响，不影响安全性，稍微影响用户使用
一星级	建议型问题，对系统功能几乎没有什么影响，不影

BUG 发生时的测试环境

macOS14.4 + Chrome

可复现性及具体步骤

可复现性：经常发生

步骤：

1. 问一个涉及学术的内容
2. 让其论证内容
3. 其能够自圆其说（即使观点是错误的）

例如：我们询问“一个半小时是几个半小时”，其回复如下：

在这里插入图片描述
实际上这是一个语言逻辑问题，一个半小时还有一种结论值得就是一个半小时，而不是三个半小时

BUF 分析

可能成因：文心一言逻辑理解能力有待提升

严重性：三星级（中等级别）

系统功能：这个 BUG 不涉及系统功能
安全性：无安全性问题
用户体验：用户体验较差，因逻辑回复错误
改进建议：迭代大模型功能

结论

c) 一般

文心一言作为国内数一数二的大模型，其功能是可以的，但是在具体的语义分析上仍然有提升空间

类别	描述	评分（满分 10 分, 良好 6 分, 及格 4 分，聊胜于无 1 分, 很差 -3 分）
核心功能	分析三个核心功能，功能设计和质量。	7
细节	有什么为用户考虑的细节?	6
用户体验	当用户完成功能时，不干扰用户 (例如: 是否不断弹出不相关广告)。	8
辅助功能	一些辅助功能如皮肤等	4
差异化功能	这个软件独特的功能. 它对用户的吸引力有多大?	4
软件的效能	占用内存, 启动速度, 内存泄漏情况	8
软件的适应性	在联网/断网, 大小屏幕, 没有鼠标的情况下都可以顺畅操作. 和不同平台的软件能流畅协作	8
成长性	记住用户的选择, 适应用户的特点，用户越用越方便	8
用户有控制权	系统状态有反馈，等待时间要合适。关键操作有确认提示，有明确的错误信息。让用户方便地从错误中恢复工作, 快捷操作键可调整。	8
博客质量	审核筛选垃圾信息博客，博客对用户是否有帮助。	6
总分		75