软件工程实践——软件评测作业

最新推荐文章于 2025-04-28 22:12:08 发布

凡尘雨季

最新推荐文章于 2025-04-28 22:12:08 发布

阅读量2.3k

点赞数 54

文章标签：软件工程

本文链接：https://blog.csdn.net/qq_65154275/article/details/137735835

版权

本文分析了人工智能助手Kimi和讯飞星火的优缺点，包括语言处理能力、文件解读、BUG报告和测试环境。Kimi在信息处理上表现全面但存在文件修改和特定功能缺失，而讯飞星火则在绘画和文件解析上存在问题。软件工程方面提出优化算法和功能扩展的建议。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这个作业属于哪个课程	班级链接
这个作业要求在哪里	作业链接
这个作业的目标	完成软件测评作业
其他参考文献	《构建之法》

调研，测评

Kimi

Kimi是由月之暗面科技有限公司开发的人工智能助手，专门设计来提供帮助和信息。Kimi诞生于2023年10月10日，拥有强大的语言处理能力，尤其擅长中文和英文的对话交流。Kimi的目标是为用户提供安全、有帮助且准确的信息，同时遵守中华人民共和国的法律法规。作为一个智能助手，Kimi具备多种功能，包括但不限于阅读和理解各种文档格式（如TXT、PDF、Word文档、PPT幻灯片、Excel电子表格等），解析网页内容，并结合搜索结果来回答问题。Kimi能够处理大量的信息，最多支持20万字的输入和输出，这使得Kimi能够处理复杂的查询和任务。Kimi的设计注重用户隐私和数据安全，它会拒绝回答可能涉及恐怖主义、种族歧视、黄色暴力、政治敏感等不当内容的问题。同时，Kimi也会在必要时提醒用户遵守相关法律法规，确保对话内容的合法性和适当性。Kimi的智能不仅体现在信息处理上，还包括对用户需求的理解和适应。Kimi会根据用户的指令和问题，提供直接、详尽且有帮助的回答。即使面对超出能力范围的请求，Kimi也会礼貌地告知用户，并尽可能提供替代的解决方案。

体验

解答问题
在这里插入图片描述

网站内容解析
这里我提供了另一款软件讯飞星火的网址，Kimi给出了该网站的详细解读。
在这里插入图片描述

文件解读
在这里我提供了一个txt文件，文件内容如图下所示
在这里插入图片描述
Kimi对文件内容进行了精准的解读

但是我想让Kimi帮忙修改文件无法实现，只能给出相应的修改步骤。

尝试让Kimi解读敏感话题
在这里插入图片描述

尝试让Kimi画图
在这里插入图片描述

优缺点

优点

回答结果非常全面
回答迅速，即时性强
涉及敏感话题时处理得当
提供用户反馈功能

缺点

无法完成特定功能，例如画图
无法修改上传的文件
无法与用户共情
提供的功能太少

改进意见

增加画图功能
优化读取文件算法，增加修改文件功能
新增功能，例如解析图片

用户采访
采访对象背景：高中同学，计算机科学与技术大三学生
原因：

计算机专业学生
使用过其他AI大模型，从未使用过Kimi，有对Kimi的需求

TA的需求：写代码
在这里插入图片描述
评价：挺好用的

BUG

BUG发生时的测试环境

操作系统：win 11
浏览器环境与版本：Microsoft Edge 版本 123.0.2420.81 (正式版本) (64 位)
发生的时间段：2024/4/14

Bug的可复现性及具体复现步骤

描述：文件读取错误
可复现性：经常发生
复现步骤：发给他一个Excel文件，写入大量1，修改其中一个为0，然后传给Kimi并且让它完成以下任务：列举出文件中出现的数据，并统计每个数据的出现次数。

在这里我提供了一个Excel文件，文件中除了左上角第一个数据为0之外其他都是1（数据0已标记），文件内容截图如下。
在这里插入图片描述
通过让Kimi解读该文件两次得到如下不同结果

这里我传给它的是同一份文件，解读时却得到了不同的答案，并且没有读取出单独的数据0

BUG分析

成因：文件数据解析算法不过关
严重性：

系统功能：影响读取文件的准确性
安全性：没影响
用户体验：很差，同一个文件读取竟然出现如此大的差别，与期待的结果大相径庭。

改进意见：加强读取文件的能力，充分完整读取用户上传的文件，并且自行检查正确性。

结论

体验一般
综合得分：6分
推荐指数（满分5颗星）：⭐️⭐️⭐️

讯飞星火

讯飞星火认知大模型是科大讯飞推出的新一代认知智能大模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务，提供语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力

体验

解答问题
在这里插入图片描述

画图
在这里插入图片描述

尝试解读敏感话题
在这里插入图片描述

写文案
在这里插入图片描述

识别图片

在这里插入图片描述

优缺点

优点

种类丰富，提供了多种助手，针对不同需求有不同助手，特别时提供了绘画助手
提供用户反馈功能
识别图片内容

缺点

无法接收文件
无法解析网站

改进意见

新增接收文件，解析文件功能
新增解析网站内容功能

用户采访
采访对象背景：高中同学，计算机科学与技术大三学生
原因：

计算机专业学生
从未使用过AI大模型

TA的需求：解答问题
在这里插入图片描述

评价：回答清楚明朗

BUG

BUG发生时的测试环境

操作系统：win 11
浏览器环境与版本：Microsoft Edge 版本 123.0.2420.81 (正式版本) (64 位)
发生的时间段：2024/4/14

BUG的可复现性

描述：绘画出错
可复现性：经常发生
复现步骤：让讯飞星火的绘画助手任意画一些，并在次基础上进行修改

通过结果可以看到，这幅图片根本不符合要求

手里拿的不是我要求的书，而是包
头上没有顶着一本书

这里在上一个图的基础上修改，但是绘画助手却直接重新画了一张图
在这里插入图片描述

BUG分析

成因：绘画算法不过关
严重性：

系统功能：影响绘画准确性
安全性：没影响
用户体验：一般

改进意见：改善绘画算法

结论

体验好，不错
综合得分：8分
推荐指数（满分5颗星）：⭐️⭐️⭐️⭐️

分析

开发时间估计

一年

软件工程方面的建议

优化代码，优化算法，对AI大模型加大训练，优化处理用户需求的算法。
评估与验证：在训练过程中，定期评估模型的性能，以便及时发现潜在问题。

BUG存在的原因分析

Kimi的BUG原因大概率是测试把关不严，对于少量数据的文件可以做到精准分析，凡是对于含有大量数据的文件分析时就会出错
讯飞星火绘画算法还不算成熟，应该加强绘画助手训练

建议和规划

市场概况

市场规模：AI大模型已经在许多行业和领域得到广泛应用，如金融、医疗、教育、智能制造、无人驾驶等。这些应用为AI大模型创造了巨大的市场需求，推动了相关技术和产品的快速发展。
直接用户：科研人员，技术爱好者，政府
潜在用户：教育机构，金融业，交通运输

市场现状

市场上已经有的产品：chatgpt，文心一言，讯飞星火…
产品优势

响应速度快
全天候24小时可以响应用户需求
多种语言支持

产品劣势

成本高昂，需要花费大量时间成本训练，对训练所使用的计算机，芯片要求高
知识库具有滞后性，训练AI大模型只能基于历史数据，可能会造成偏差
对于某种特定需求表现欠佳，例如说图形处理以及语音识别等等

产品间关系与竞品态势

关系：竞争，互补
竞品关系：互为竞争关系
态势：严峻，白热化阶段，各厂商都想拉拢用户使用自家产品，不断地迭代更新，推陈出新。
领域：正处在成长阶段。

市场与产品生态

核心用户群

学历：平均教育水平应在高等教育水平以上
年龄：18-50岁左右
专业：覆盖广泛
爱好：对新科技，新技术有很大的兴趣
收入：范围广
表面需求：解决问题，求知，学习技术
潜在需求：提升工作效率，情感互动，娱乐消遣

用户群体间关系：
多样化且可能彼此独立，又存在交叉互动的可能性

彼此独立：很多用户之间并没有直接联系，他们使用我服务的原因和目的可能完全不同，因此他们之间的交互非常有限或根本不存在。
交叉互动：在企业、教育机构或研究组织中，用户可能会以团队的形式共同工作，使用AI大模型来协助完成项目、研究和任务。

有利用其相互作用二次构成特定用户生态的可能性

社区构建：通过提供共同的兴趣点或目标，AI可以帮助用户建立在线社区，用户可以在这些社区内交流信息、分享经验、相互支持和协作
协同工作：在企业或团队环境中，AI可以协助进行项目管理、任务分配和进度跟踪，从而促进团队成员之间有效的协作。

子产品与其他相关产品间的关系：

API和集成：很多AI服务通过提供应用程序编程接口（API）来允许其他软件或服务与其进行交互。这些API的存在使得AI功能可以被嵌入到第三方应用中，从而形成一种生态系统关系。
数据共享：AI系统往往需要大量数据来训练和优化模型。在这个过程中，可能会涉及到数据的导入和导出，将AI系统与其他数据库、存储解决方案或分析工具连接起来。

有利用各个产品特性之间的相互关系二次构成产品生态的可能性？

数据共享与分析：不同的产品可以收集不同类型的数据，通过将这些数据集中起来进行分析，可以提供更全面的洞察力和更好的用户体验。例如，健康追踪设备、饮食记录应用和睡眠监测工具可以共同工作，为用户提供综合的健康建议。
跨平台集成：软件和服务可以通过API集成，允许用户在一个平台上启动和交互另一个平台的功能。
合作伙伴：通过与其他公司建立合作伙伴关系，可以互相推荐对方的产品或联合开发新产品，从而创建一个更加丰富的产品网络。

产品规划

新功能

功能：情感交互
NABCD分析：
需要(Need)：在AI大模型的情况下，增加情感交互能力的需求可能来源于用户希望与AI进行更人性化的交流，提高用户体验。

可行性(Approach)：这可能涉及使用更先进的自然语言处理技术，例如情感分析，以理解用户的情绪状态并相应地调整响应。还可能需要引入机器学习算法来训练AI更好地理解和模拟人类的情感反应。

收益(Benefit)：实施这个功能的预期收益是什么？在这种情况下，主要的好处可能是提高用户满意度和参与度，使用户感到更舒服和愉快，从而增加用户的忠诚度和产品的吸引力。

竞争(Competition)：我们还需要考虑市场上的竞争情况。如果竞争对手的产品已经具有情感交互功能，那么为了保持竞争力，我们也需要实现这个功能。另一方面，如果我们是第一个实现这个功能的，那么这将为我们提供竞争优势。

交付(Delivery)：最后，我们需要考虑如何将这个功能交付给用户。这可能涉及软件更新。

团队配置

分析师：1人
前端美工：1人
后端开发：3人
测试：1人

规划

第1-4周：需求收集与分析
第1周：开会，明确项目目标和范围。
第2周：收集用户需求，编写需求文档。
第3周：分析师与开发团队一起评审需求文档，确认需求的可实施性。
第4周：完成需求分析和规划。

第5-8周：设计与开发
第5周：完成系统架构设计，分配具体开发任务。
第6-7周：进行主要功能模块的开发。
第8周：完成基本功能的开发。
第9-12周：初步测试与迭代开发。
第9-10周：进行单元测试和集成测试。
第11周：根据测试结果进行问题修复和功能调整。
第12周：完成所有功能的开发。

第13-15周：用户验收测试与最终调整。
第13周：向用户交付测试版，开始用户验收测试。
第14周：收集用户反馈，优先解决关键问题。
第15周：完成所有已知问题的修复，准备发布。

第16周：正式发布软件改进版本。