软件工程实践——软件评测作业

Tavis123

已于 2024-04-15 23:20:19 修改

阅读量1.1k

点赞数 19

文章标签：软件工程人工智能

于 2024-04-15 23:12:41 首次发布

本文链接：https://blog.csdn.net/m0_61811341/article/details/137799429

版权

这个作业属于哪个课程	2302软件工程
这个作业要求在哪里	作业要求
这个作业的目标	评测现有网站
其他参考文献	构建之法

第一部分调研，评测

一、kimi

1、使用体验

（1）介绍和使用软件
Kimi是2023年10月推出的一款智能助手，主要应用场景为专业学术论文的翻译和理解、辅助分析法律问题、快速理解AAPI开发文档等，是全球首个支持输入20万汉字的智能助手产品。

可以选择手机号登录或者微信登录，刚进入网站有若干长文本例子，点击可以快速提问
创建新会话，可以和kimi展开交流
可以查看历史会话记录，并进行删除会话和修改会话名
可以向kimi官方提交用户反馈，反馈自己的使用建议

（2）优缺点分析

优点：
- ui界面简洁明了，主要功能十分突出，让用户可以快速上手使用
- 大模型助手在回答问题时会附带它从网上搜索的链接，方便用户了解更详细的信息，同时也可以选择关闭kimi的互联网访问权限
- 可以设置常用语，使用更方便，用户可以定制化自己的AI助手，输入关键字就可以快速调用常用语
- 可以上传文件（最多50个，每个不超过100MB），因此不局限于语言助手，可以让用户通过更多方式提问
缺点：
- 产品功能相比其他竞品而言偏简单，例如没有“我的收藏”、“角色扮演”、“多端体验”等功能

（3）改进意见

建议可以添加一些个性化功能，如“发现”、“我的订阅”等功能，增加用户的使用粘性

（4）用户采访

采访对象背景：fzu2022级软件工程专业学生
采访记录：

2、BUG描述

bug严重性	bug级别	量化标准
五星级	致命级别	致命性系统故障，例如系统完全崩溃，无法正常运行
四星级	严重级别	用户体验较差，例如界面混乱或者操作流程不顺畅
三星级	中等级别	功能缺陷，例如某些功能无法按照预期工作，但不影响整体系统运行
二星级	轻微级别	轻微功能缺陷，例如界面显示问题或者部分功能不完善
一星级	建议性级别	用户体验可以提升，但不影响系统的正常使用

（1）Bug发生时的测试环境

windows 11 + google chrome

（2）Bug的可复现性及具体复现步骤

可复现性：必然发生
复现步骤：

（3）Bug具体情况描述
bug1
我发现当历史会话中只剩下一个会话时，此时删除当前会话后，当前会话的界面仍会保留，即界面不会自动刷新并新建一个新会话，而且界面的各个按钮功能都会出现“死机”状态，即点击了没反应。刷新页面后，页面才可以重新使用。

（4）Bug分析

可能成因：可能是由于未正确管理会话状态或者页面元素的更新不及时所致
严重性：二星级（轻微级别）
- 系统功能：这个Bug会导致页面处于卡死状态，影响了系统的功能性
- 安全性：页面卡死并不涉及到系统的安全性问题，没有暴露用户的敏感信息或者给系统带来安全威胁
- 用户体验；页面卡死会导致用户体验下降，用户无法正常操作页面，需要刷新页面才能继续使用
改进建议：建议检查代码中与会话管理和页面刷新相关的部分，确保在删除会话后能够正确地更新页面状态并且确保用户能够继续正常使用

3、结论

c）一般，用了这么多款大模型AI助手，我认为这款的简洁性可以排前三，这个特点是优点也算缺点。

类别	描述	评分（满分 10 分, 良好 6 分, 及格 4 分，聊胜于无 1 分, 很差 -3 分）
核心功能	分析三个核心功能，功能设计和质量。	7
细节	有什么为用户考虑的细节?	6
用户体验	当用户完成功能时，不干扰用户 (例如: 是否不断弹出不相关广告)。	8
辅助功能	一些辅助功能如皮肤等	4
差异化功能	这个软件独特的功能. 它对用户的吸引力有多大?	4
软件的效能	占用内存, 启动速度, 内存泄漏情况	8
软件的适应性	在联网/断网, 大小屏幕, 没有鼠标的情况下都可以顺畅操作. 和不同平台的软件能流畅协作	8
成长性	记住用户的选择, 适应用户的特点，用户越用越方便	8
用户有控制权	系统状态有反馈，等待时间要合适。关键操作有确认提示，有明确的错误信息。让用户方便地从错误中恢复工作, 快捷操作键可调整。	8
博客质量	审核筛选垃圾信息博客，博客对用户是否有帮助。	6
总分		75

二、文心一言

1、使用体验

（1）介绍和使用软件
文心一言是百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动、回答问题、协助创作，高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习，得到预训练大模型，在此基础上采用有监督精调、人类反馈强化学习、提示等技术，具备知识增强、检索增强和对话增强的技术优势。

使用AI绘图
使用AI编写代码
使用AI生成活动策划方案

（2）优缺点分析

优点：
- 广泛的知识储备：文心一言经过大量的数据训练，拥有广泛的知识储备，能够回答各种问题，提供丰富的信息。
- 自然的语言交互：它能够以自然的方式与人类进行交互，理解并生成人类可以理解的语言，使得对话更加流畅和自然。
- 多任务处理能力：文心一言不仅可以进行问答，还可以进行文本创作、知识推理、数学计算等多种任务，展现出强大的多任务处理能力。
缺点：
- 对特定领域的深度理解不足：尽管文心一言拥有广泛的知识储备，但在某些特定领域，它可能无法提供深入和专业的解答，这需要依赖领域专家的知识和经验。
- 误解或错误回答的可能性：由于语言的复杂性和多样性，文心一言有时可能会误解问题或给出错误的回答。这在使用时需要用户进行验证和核实。

（3）改进意见

增强领域专业性
提升语境理解能力
优化回答的逻辑性和连贯性

（4）用户采访

采访对象背景：fzu2022级计算机科学与技术专业学生
采访记录：

2、BUG描述

bug严重性	bug级别	量化标准
五星级	致命级别	致命性系统故障，例如系统完全崩溃，无法正常运行
四星级	严重级别	用户体验较差，例如界面混乱或者操作流程不顺畅
三星级	中等级别	功能缺陷，例如某些功能无法按照预期工作，但不影响整体系统运行
二星级	轻微级别	轻微功能缺陷，例如界面显示问题或者部分功能不完善
一星级	建议性级别	用户体验可以提升，但不影响系统的正常使用

（1）Bug发生时的测试环境

windows 11 + google chrome

（2）Bug的可复现性及具体复现步骤

可复现性：经常发生
复现步骤：首先让文心一言画一幅图，然后修改图中的一些要素，就会出现错误的反馈

（3）Bug具体情况描述

在使用文心一言AI绘图功能时，我想要让它根据我的要求修改图片，它无法正确理解我的意思，并反复绘制错误的图片。

bug1

bug2

（4）Bug分析

可能成因：文心一言无法正确理解上下文语境
严重性：三星级（中等级别）
- 系统功能：这一bug降低了AI绘图功能的准确性，导致该功能不完整
- 安全性：不存在安全性的问题
- 用户体验；用户体验性低，用户只有在第一次生成时的图片相对准确，后续提出的修改要求都无法满足
改进建议：进行功能迭代和大模型优化，提高上下文理解正确性

3、结论

d）好，不错，文心一言可以算是国内最强的大模型助手之一，他的功能完善性毋庸置疑，整体体验感也不错。

类别	描述	评分（满分 10 分, 良好 6 分, 及格 4 分，聊胜于无 1 分, 很差 -3 分）
核心功能	分析三个核心功能，功能设计和质量。	8
细节	有什么为用户考虑的细节?	9
用户体验	当用户完成功能时，不干扰用户 (例如: 是否不断弹出不相关广告)。	7
辅助功能	一些辅助功能如皮肤等	7
差异化功能	这个软件独特的功能. 它对用户的吸引力有多大?	9
软件的效能	占用内存, 启动速度, 内存泄漏情况	9
软件的适应性	在联网/断网, 大小屏幕, 没有鼠标的情况下都可以顺畅操作. 和不同平台的软件能流畅协作	7
成长性	记住用户的选择, 适应用户的特点，用户越用越方便	8
用户有控制权	系统状态有反馈，等待时间要合适。关键操作有确认提示，有明确的错误信息。让用户方便地从错误中恢复工作, 快捷操作键可调整。	8
博客质量	审核筛选垃圾信息博客，博客对用户是否有帮助。	8
总分		80

第二部分分析

一、开发时间估计

开发一个类似网站大约3到6个月的时间，具体估计如下：

需求分析和规划（1-2周）
在项目开始之前，首先需要对项目进行详细的需求分析。这包括确定网站的功能、目标用户群体、用户体验要求等。
系统设计（1-3周）
根据需求分析的结果，接下来需要进行系统设计。这包括架构设计、数据库设计、API设计等。在这个阶段，团队需要确定技术栈和开发工具，并设计出系统的整体架构。
前端开发（4-8周）
前端开发包括界面设计和前端功能实现。专业UI支持将在这个环节发挥重要作用，确保网站具有优秀的用户界面和用户体验。
后端开发（4-8周）
后端开发包括服务器、数据库和应用程序逻辑的开发。这个阶段需要根据功能需求来编写和测试代码，确保系统的稳定性和安全性。
集成和测试（2-4周）
所有组件开发完成后，接下来需要进行集成和测试。这个阶段需要确保所有的功能模块能够无缝集成，并进行全面的测试来发现和修复bug。
部署和优化（1-2周）
在网站开发完成并通过测试后，最后一步是部署和优化。这个阶段包括将网站部署到服务器、进行性能优化和确保网站的可扩展性。

二、同类产品的优劣对比

kimi：kimi的核心优势在于其强大的语言处理能力和超长文本处理功能，支持200万字的长文本输入，领先于同类产品。Kimi的界面设计简洁直观，响应快速，提供良好用户体验。Kimi能够处理多种文件格式和访问互联网，为用户提供安全、有帮助、准确的回答。但Kimi目前无法创建文档或提供下载链接，这会在一定程度上限制其在某些使用场景下的便利性。综合来看，在国内可以排进前五。
文心一言：文心一言相较于同类产品，其优势在于强大的语义理解和生成能力。它基于深度学习技术，能够准确捕捉用户的意图，提供精准、流畅的回答和对话体验。此外，文心一言还具备丰富的知识库和学习能力，能够持续吸收新知识，不断提升自身的性能。但它对于复杂或模糊的问题，偶尔难以给出完全准确的答案，需要用户进行进一步的澄清或补充。综合来看，在国内排名前三是没问题的。

三、优化建议

kimi：定期进行代码审查可以帮助团队成员分享知识，提高代码质量，并减少潜在的错误和漏洞。
文心一言：通过优化模型结构和引入更多相关领域知识，提升模型对用户意图的捕捉和响应能力，从而改善用户体验。

四、BUG可能原因

kimi：开发过程中，可能由于疏忽或不够细致，导致一些细节问题没有得到妥善处理。例如，可能在编写代码时遗漏了一些边界条件的判断，或者在实现某个功能时没有考虑到所有可能的使用场景，这些都可能导致在特定情况下出现异常。
文心一言：AI绘图功能的设计可能存在缺陷，如算法逻辑错误或处理流程不当。模型的架构或参数设置可能不适合处理复杂的绘图指令或图像修改任务。

五、团队的潜在问题

kimi：
- 问题：测试用例不全面或自动化测试覆盖率低。
- 改进：加强测试用例的编写和自动化测试的实施，确保覆盖各种边界条件和异常情况。使用持续集成和持续部署来提高测试效率。
文心一言：
- 问题：在快速变化的市场环境下，用户需求经常发生变化，导致团队难以准确捕捉和满足需求。
- 改进：建立需求管理流程，确保需求准确、完整地转化为技术实现。

第三部分建议和规划

一、市场概况

1、市场规模

随着人工智能技术的不断进步和应用场景的日益丰富，AI大模型在中国得到了广泛的关注和应用。据数据，2023年，我国AI大模型行业市场规模为147亿元，预计2024年将增长至216亿元。随着技术的不断进步和应用场景的拓展，相信AI大模型将在未来发挥更加重要的作用，推动中国人工智能产业的持续发展和创新。

2、直接用户

目前多家科技厂商推出的AI大模型已在金融、医疗、政务等多个领域取得显著成果，提升了服务质量和效率。这些领域的企业和组织都可能成为AI大模型的直接用户。然而，具体的用户数量需要进一步的市场调研和数据支持。

3、潜在用户

考虑到AI大模型的应用前景广泛，其潜在用户群体可能非常庞大。随着技术的进步和应用场景的拓展，AI大模型有望在更多领域得到应用，从而吸引更多的潜在用户。例如，在智能制造、智慧城市、智能家居等领域，AI大模型都有望发挥重要作用，进而扩大其用户基础。

二、市场现状

1、市场产品

AI大模型市场已经涌现出众多产品，其中包括科大讯飞的讯飞星火认知大模型、百度公司的文心一言大模型、阿里巴巴的通义千问大模型等。这些大模型不仅具有强大的计算能力，还能处理大规模数据，提升模型的准确性和预测能力。此外，还有针对特定行业的大模型，如蜜度的文修大模型、容联云的赤兔大模型以及用友的YonGPT大模型等。同时，市场上也存在具有云侧和端侧大模型的端云结合AI大模型，如vivo的蓝心大模型，以及以蔚来的NOMIGPT大模型为代表的端侧AI大模型。

2、产品定位、优劣势

科大讯飞讯飞星火认知大模型：定位为通用AI大模型，优势在于其语言理解、数学能力、语音交互能力等功能上的卓越表现，并且在代码能力和多模态理解方面也具备较高水准。劣势可能在于与竞争对手相比，其在某些特定领域的应用可能还需要进一步细化和优化。
百度文心一言大模型：作为另一款通用AI大模型，其优势在于百度强大的技术积累和海量数据资源，使得模型在多个领域都有出色表现。然而，劣势也可能在于对于某些特定行业的定制化需求，可能需要进一步的开发和调整。
行业AI大模型（如蜜度的文修大模型）：这些模型针对特定行业进行深度优化，具有更强的行业适应性和专业性。优势在于能够满足行业特定的需求，提供更为精准的解决方案。但劣势可能在于其通用性相对较弱，难以跨行业应用。

3、产品关系

市场上的AI大模型产品之间存在一定程度的竞争关系，尤其是在通用AI大模型领域。这些产品在功能、性能和应用场景上有所重叠，因此需要在市场中争夺用户和资源。然而，由于AI大模型技术的复杂性和多样性，不同的产品在某些特定领域或功能上可能具有独特的优势，从而形成差异化的竞争格局。

4、领域所处阶段

AI大模型领域目前正处于成长阶段。随着技术的不断进步和应用场景的不断拓展，AI大模型的市场规模正在快速增长，吸引了越来越多的企业和资本进入这个领域。同时，政府也在积极推动人工智能技术的发展，为AI大模型产业提供了良好的发展环境。然而，这个领域仍然面临着一些挑战，如算力瓶颈、数据隐私和安全等问题，需要行业内的企业和研究机构共同努力解决。

三、市场与产品生态

1、核心用户群

AI大模型的核心用户群主要包括企业用户和个人用户两大类。企业用户通常是对AI技术有较高需求，希望通过AI大模型提升业务效率、降低成本或创新业务模式的企业或组织。个人用户则是对AI技术感兴趣，希望通过AI大模型实现个人能力提升或创新应用的个人用户。

2、用户群体关系与生态构建

用户群体之间确实存在一定的关系，这些关系可以基于共同的需求、兴趣或行业背景而形成。例如，同一行业的不同企业用户可能面临类似的业务挑战，他们可以通过共享经验、合作开发等方式来共同推动AI大模型的应用和发展。个人用户之间也可以通过社区、论坛等平台进行交流和学习，共同提升AI大模型的应用能力。利用这些相互作用，可以二次构成特定的用户生态。例如，可以建立行业用户联盟或社区，促进用户之间的信息共享、经验交流和合作创新；也可以为个人用户提供在线学习平台、技术竞赛等活动，激发他们的创新热情和参与积极性。

3、产品子产品与其他产品关系

AI大模型的子产品和其他相关产品之间也存在一定的关系。子产品通常是针对特定领域或需求而开发的，它们可以基于AI大模型的核心能力进行扩展和优化，为用户提供更加细分和专业的解决方案。其他相关产品则可能是与AI大模型相关的工具、平台或服务，它们可以与AI大模型进行集成或互补，共同构成一个完整的解决方案。利用各个产品特性之间的相互关系，可以二次构成产品生态。例如，可以将AI大模型与数据处理工具、可视化平台等进行集成，为用户提供从数据预处理到模型训练、应用部署的一站式解决方案；也可以将AI大模型与云计算平台、边缘计算设备等进行融合，实现模型的灵活部署和高效运行。

四、产品规划

1、新功能分析

新功能名称：智能对话创作助手
NABCD分析：
- Need 需求：
  在当前数字化时代，内容创作的需求日益旺盛，无论是个人还是企业，都需要高效、便捷的创作工具。智能对话创作助手能够满足用户在文本创作过程中的个性化需求，提供智能化的创作支持。
- Approach 做法：
  利用深度学习和自然语言处理技术，构建智能对话模型，通过自然语言交互的方式，理解用户的创作意图，并生成符合用户需求的文本内容。
- Benefit 好处：
  智能对话创作助手能够极大地提升用户的创作效率，减少创作过程中的困扰和瓶颈。同时，它还能够激发用户的创作灵感，帮助用户更好地组织和表达思想。
- Competitors 竞争：
  智能对话创作助手的核心优势在于其深度学习和自然语言处理技术的应用，能够更准确地理解用户需求，并提供个性化的创作支持。此外，通过不断优化算法和模型，该功能还可以不断提升其准确性和实用性。
- Delivery 推广
  通过线上线下多渠道宣传，包括社交媒体广告、内容营销、合作伙伴推广等方式，将智能对话创作助手的功能和特点传达给目标用户群体。同时，可以举办一些创作比赛或活动，吸引用户参与并体验该功能。

2、团队配置

开发人员：3名，负责功能的后端开发、接口对接以及前端界面的实现。
测试人员：1名，负责功能的测试工作，包括单元测试、集成测试和用户测试。
美工/UI设计师：1名，负责界面设计和用户体验优化。
产品经理：1名，负责功能的整体规划、需求收集和项目管理。

3、16周详细规划

第1-2周：
- 产品经理：进行市场调研和用户需求分析，确定功能的具体需求和目标。
- 开发人员：进行技术预研和方案设计，搭建开发环境。
第3-4周：
- 开发人员：开始后端开发，包括数据模型设计、接口开发等。
- 美工/UI设计师：设计界面原型和交互流程。
第5-6周：
- 开发人员：完成后端主体功能开发，开始前端界面开发。
- 测试人员：编写测试用例，准备测试环境。
第7-8周：
- 开发人员：前后端联调，优化性能。
- 测试人员：进行单元测试，确保代码质量。
第9-10周：
- 开发人员：根据测试反馈进行功能修复和优化。
- 美工/UI设计师：根据反馈调整界面设计，提升用户体验。
第11-12周：
- 测试人员：进行集成测试和用户测试，收集用户反馈。
- 产品经理：分析测试数据和用户反馈，调整功能细节。
第13-14周：
- 开发人员：根据测试结果进行最后的修复和优化。
  美工/UI设计师：完成界面最终设计，准备发布。
第15周：
- 产品经理：撰写发布文档和宣传材料。
- 全体成员：进行内部培训和演练，确保发布顺利。
第16周：
- 全体成员：正式发布新功能，监控运行情况，及时处理用户反馈和问题。

Tavis123

关注

19
点赞
踩
15

收藏

觉得还不错? 一键收藏
1
评论
软件工程实践——软件评测作业

此外，还有针对特定行业的大模型，如蜜度的文修大模型、容联云的赤兔大模型以及用友的YonGPT大模型等。同时，市场上也存在具有云侧和端侧大模型的端云结合AI大模型，如vivo的蓝心大模型，以及以蔚来的NOMIGPT大模型为代表的端侧AI大模型。综合来看，在国内可以排进前五。随着技术的不断进步和应用场景的拓展，相信AI大模型将在未来发挥更加重要的作用，推动中国人工智能产业的持续发展和创新。然而，由于AI大模型技术的复杂性和多样性，不同的产品在某些特定领域或功能上可能具有独特的优势，从而形成差异化的竞争格局。
复制链接

扫一扫