软件工程实践——软件评测作业

Dune_333

已于 2024-04-16 17:15:22 修改

阅读量1.7k

点赞数 52

文章标签：软件工程 hadoop hdfs

于 2024-04-16 07:32:00 首次发布

本文链接：https://blog.csdn.net/Dune_333/article/details/137803975

版权

本文详细评测了文心一言和通义千问在功能、优缺点、用户体验和开发时间等方面的性能，并给出了软件工程实践课程中的市场分析和改进建议，包括优化AI逻辑、界面设计和解决bug等问题。

摘要由CSDN通过智能技术生成

作业基本信息

这个作业属于哪个课程	软件工程实践-2023学年-W班
这个作业要求在哪里	软件工程实践——软件评测作业
这个作业的目标	通过各种案例分析，评测，思辨，总结，我们就能看到软件工程的原则在实践中的种种体现，学好软件工程，帮助我们在实践中做得更好。
其他参考文献	软件工程案例分析作业

第一部分调研，评测

文心一言

体验

1. 功能介绍

1.1 问答

用户使用对话框输入内容与大语言模型直接对话，大语言模型给出对应的回答
包括纯语言回答和图片回答
配合插件可以专注回答，强化对应能力，包括解析文档和图片

在这里插入图片描述

1.2 百宝箱

帮助用户创建场景问题，生成要求

在这里插入图片描述

2. 优缺点分析

优点:
1.准确度是国内环境下最强的大语言模型，使用方便，其回答在大部分领域较浅层时可以提供相对准确的答案。
2.功能性方面，各式插件提供了哪怕gpt4都不能给予的优秀体验，在处理问题的方向上集成度高，方便一站式使用

缺点:
1.数据量不足，与最优秀的大语言模型仍有一定差距，时常让人感到不够“智能”，撞入死胡同后无法自我纠正，也无法根据用户提示纠正。
2.ui界面较差，不符合ai高智能的风格，页面逻辑较差，有点像随便找个人来设计的

在这里插入图片描述

3. 改进意见

继续优化模型算法，增加服务器算力，继续强化核心功能

4. 用户意见

采访对象
学号——222100213
背景——同宿舍舍友，平常使用ai不多。

记录
栏目——逻辑问答模块
问题——让文心一言进行逻辑问答时，即使问题本身出错，也会给出信誓旦旦的结论，出现明显的逻辑错误，并不能自知。
改进——继续优化

BUG

测试环境
操作系统——Windows 10 家庭中文版 22H2
操作系统内部版本——19045.4170
浏览器——Chrome
浏览器版本——123.0.6312.88 (正式版本) （64 位） (cohort: Stable)

BUG描述
可复现性——有几率
复现操作——在任意一个问题，在回答还没生成完毕时，切换到历史记录中。反复切换几次后，回答不再生成，画面卡住，有时中断

在这里插入图片描述

BUG严重性 ★☆☆☆☆
系统功能——影响了会话间的自如切换功能,但这是极限场景，一般使用中较难复现
安全问题——几乎不影响用户信息，服务器信息等安全性问题
用户体验——影响喜欢反复切屏的用户，导致回答生成卡断，影响体验

BUG分析
可能成因——每次处理对话可能都被视为一次用户发起的请求，在生成过程中切换对话，服务端可能为节省资源，就中断了这次请求，反复切换后，服务端视此为异常请求次数，暂时中断此对话
预期和改进——放宽对单位时间内对请求数的限制，不至于影响到个人用户的体验

结论

好，不错
可圈可点，尤其是笔者使用半年来模型效果进步喜人，未来可期

通义千问

体验

1. 功能介绍

1.1 问答

用户使用对话框输入内容与大语言模型直接对话，大语言模型给出对应的回答
包括了纯语言回答和图片回答
配合插件可以专注回答，强化对应能力

在这里插入图片描述

1.2 百宝袋

基本是对标了文心一言的百宝箱，但界面逻辑更为清晰，不像文心一言直接粗暴生成对应的提问，而是在新界面提示关键词

在这里插入图片描述

2. 优缺点分析

优点:
1.准确度略逊于文心一言，使用方便，其回答在大部分领域较浅层时也可以提供相对准确的答案。
2.ui界面较佳，符合ai高智能的风格，简约时尚，页面逻辑佳。
3.功能性方面，功能相对文心一言较少。

缺点:
1.数据量不足，与最优秀的大语言模型仍有一定差距。
2.生成速度较慢

3. 改进意见

继续优化模型算法，增加服务器算力，继续强化核心功能

4. 用户意见

采访对象
学号——222100215
背景——同班同学，平常基本没有接触AI文本大模型。

记录
栏目——事实问题问答模块
问题——让文心一言进行事实问答时，如果数据未及时更新，很可能给出错误的结论。
改进——继续优化

BUG

测试环境
操作系统——Windows 10 家庭中文版 22H2
操作系统内部版本——19045.4170
浏览器——Chrome
浏览器版本——123.0.6312.88 (正式版本) （64 位） (cohort: Stable)

BUG描述
可复现性——必然发生
复现操作——在通义千问的图片描述功能中，在上传完图片并给出要求后，在文本未生成完毕时刷新页面，再提交问题，停止回答

在这里插入图片描述

BUG严重性 ★★★★☆
系统功能——极大影响了用户使用体验
安全问题——几乎不影响用户信息，服务器信息等安全性问题
用户体验——影响喜欢反复刷新的用户，导致回答生成卡断，影响体验

BUG分析
可能成因——每次处理对话可能都被视为一次用户发起的请求，在生成过程中切换对话，服务端可能为节省资源，就中断了这次请求，反复切换后，服务端视此为异常请求次数，暂时中断此对话
预期和改进——放宽对单位时间内对请求数的限制，不至于影响到个人用户的体验

结论

文本问答模块设计优秀，百宝箱中的工具实用，ui不错，在持续加强模型能力后未来可期

第二部分分析

开发时间估计

软件名称	功能模块	预估时间
文心一言	大模型3.5版与4.0版、百宝箱、图像文件识别	610天
通义千问	大模型、百宝袋、图像文件识别，文档文件识别	410天

对比排名	1	2
界面设计	通义千问	文心一言
功能性	文心一言	通义千问
准确性	文心一言	通义千问
数据量	文心一言	通义千问

软件工程方面的建议？

软件名称	建议
通义千问	1. 优化生成速度。 2 解决BUG，解决刷新页面会出现的BUG。
文心一言	1… 优化AI逻辑，强化自我纠错功能。 2. 界面优化，界面太丑太丑了，应该设计成简约高级的风格，而不是到处打广告升级vip，土到家。 3. 优化文生图模块，别总是闹出“车水马龙”的笑话。

第三部分建议和规划

市场概况

1.1、市场大小

IDC于近日发布了2023年V2版IDC《全球人工智能支出指南》(IDC Worldwide Artificial Intelligence Spending Guide)。IDC最新数据显示，2022年全球人工智能IT总投资规模为1,288亿美元，2027年预计增至4,236亿美元，五年复合增长率（CAGR）约为26.9%。IDC预计，2027年中国AI投资规模有望达到381亿美元，全球占比约9%。

1.2、直接用户和潜在用户

直接用户：
内容创作者：如作家、记者、编辑、广告文案人员等，他们可以利用生成式AI快速生成文章、故事、广告文案等内容，提高创作效率和质量。
设计师：生成式AI可以辅助设计师生成图像、图标、UI设计等，为设计师提供灵感和创意支持。
程序员和开发者：他们可以借助生成式AI生成代码片段或进行自动化测试，减轻开发负担，加速软件开发进程。
市场营销人员：利用生成式AI进行市场调研、生成营销策略、制定推广计划等，提高市场营销效果。

潜在用户：
学生和教育工作者：学生可以利用生成式AI辅助学习，如生成学习资料、进行论文写作等；教育工作者则可以利用其进行智能教学、制定教学计划等。
普通网民：在日常生活中，人们可以利用生成式AI进行个性化的内容推荐、生成趣味图片、制作短视频等，提升用户体验。
科研人员和学者：他们可以借助生成式AI进行科学研究、数据分析、论文撰写等，推动科研进展。
商业企业和组织：各种规模的企业和组织都可以利用生成式AI提高工作效率，优化业务流程，创造新的商业价值。## 市场现状

市场现状

现有产品

目前市场上已经涌现出大量的生成式AI产品，这些产品覆盖了文本、图像、音频、视频等多个领域。具体来说，有像ChatGPT这样的文本生成工具，能够基于用户输入生成连贯的文本内容；还有像DALL-E这样的图像生成工具，能够根据文字描述生成对应的图像；此外视频生成工具sora，可以自动生成视频片段，等等。

上述产品的定位、优势与劣势：

定位:
这些生成式AI产品的定位各不相同，但总体上都是为了提高工作效率和创意性。例如，ChatGPT定位为辅助写作和对话的工具，可以帮助用户快速生成文案和回答问题。

优势:
它们的优势在于能够自动化完成大量重复性和劳动密集型的任务，使用户能够集中精力于更具创新性和策略性的工作。同时，生成式AI产品还能提供个性化的体验，如个性化推荐、定制化新闻等，从而增强用户体验和满意度。

劣势:
然而，这些产品也存在一些劣势。例如，由于技术限制，生成的内容可能在某些情况下缺乏准确性和深度，无法完全替代人类的专业工作。此外，生成式AI产品也可能面临数据安全和隐私保护的问题，需要在使用过程中加以注意。

上述产品之间呈现什么样的关系，哪些为竞品关系？以及竞争中的各方态势如何？

这些生成式AI产品之间存在一定的互补关系，它们共同构成了一个多元化的生成式AI生态。然而，在某些领域，如文本生成和图像生成，也存在竞品关系。竞品之间会通过不断提升技术水平、优化用户体验、拓展应用场景等方式来争夺市场份额。

在竞争中，各方态势因产品特性、市场定位、用户反馈等多种因素而有所不同。一些具有独特优势和创新点的产品可能在市场上脱颖而出，而一些缺乏核心竞争力的产品则可能面临被边缘化的风险。

这个领域正处于什么阶段？

目前，生成式AI领域正处于快速成长阶段。随着技术的不断进步和应用场景的不断拓宽，生成式AI产品在各个领域都得到了广泛的应用和认可。未来，随着算法的优化、算力的提升以及数据资源的丰富，生成式AI领域有望继续保持快速发展的态势，为各行各业带来更多的创新和变革。

市场与产品生态

1.核心用户群及典型用户分析

核心用户群主要是那些对生成式AI技术有浓厚兴趣，并且愿意在实际工作、学习或生活中尝试和应用的人群。他们通常具备以下特征：
学历：一般拥有较高学历，如本科及以上，对新技术有一定的接受能力和学习欲望。
年龄：集中在25至45岁之间，这一年龄段的人群既有一定的社会经验，又具备对新技术的探索和学习能力。
专业：可能涵盖多个领域，包括但不限于计算机科学、艺术设计、媒体传播等，因为这些专业背景的人群更有可能在工作中使用到生成式AI技术。
爱好：对科技创新、艺术设计、内容创作等方面有着浓厚兴趣，喜欢尝试新事物，追求效率与创意的结合。
收入：中高收入水平，因为生成式AI产品可能涉及一定的成本，包括学习成本和使用成本。
表面需求：用户希望产品能够简单、高效地完成内容生成任务，如文本创作、图像处理、视频编辑等。
潜在需求：用户期望产品能够提供更多个性化、定制化的服务，满足其特定场景下的需求，同时希望产品能够不断更新迭代，提供更多新颖、有趣的功能。

典型用户可能是一位设计师，他利用生成式AI产品快速生成设计草图，提高工作效率；或者是一位内容创作者，他借助产品生成文章或故事，丰富自己的创作素材。

2.用户群体间的关系与生态构建

产品的用户群体之间存在一定的联系和互动。例如，设计师和内容创作者可能会互相交流使用心得，分享生成的优质内容，从而形成一个基于产品的社区或社群。这种社群效应有助于增强用户的粘性和忠诚度，同时也有利于产品的推广和口碑传播。

利用用户间的相互作用，可以二次构成特定用户生态。例如，通过举办线上或线下的交流活动，促进用户之间的合作与共创，形成更加紧密的用户群体。此外，还可以根据用户反馈和需求，不断优化产品功能和用户体验，打造更加符合用户需求的产品生态。

3.子产品及相关产品间的关系与生态构建

产品的子产品和其他相关产品之间通常存在互补或协同的关系。例如，一个生成式AI产品可能包括文本生成、图像生成、语音合成等多个子产品，这些子产品可以单独使用，也可以结合使用，为用户提供更加全面和便捷的服务。

利用各个产品特性之间的相互关系，可以二次构成产品生态。例如，通过整合不同子产品的功能，打造一站式的内容生成平台，满足用户在不同场景下的需求。同时，还可以与其他相关产品进行合作，如与社交媒体平台合作，实现内容的一键分享和推广，从而扩大产品的影响力和市场份额。

产品规划

1.新功能设计

功能名称：智能内容推荐与个性化定制

设计原因：

1.1 市场需求：随着个性化服务的兴起，用户越来越期望获得符合自己兴趣和需求的内容。
1.2 用户体验提升：通过智能推荐，可以减少用户搜索和筛选内容的时间，提高使用效率。
1.3 竞争优势：当前市场上的竞品主要集中在内容生成上，智能推荐和个性化定制能够形成差异化的竞争优势。
1.4 用户吸引力：用户会使用此功能，因为它能够根据用户的历史行为和偏好，为其推荐相关内容，使得每次使用都能得到个性化、定制化的体验，增加用户的黏性和满意度。

创新点：

算法创新：采用先进的深度学习算法，结合用户画像和内容特征，实现精准推荐。

交互创新：设计简洁直观的交互界面，允许用户自定义推荐规则，满足多样化的需求。

NABCD分析：

Need：满足用户对个性化内容的需求。
Approach：通过算法优化和界面设计，实现个性化推荐功能。
Benefit：提高用户体验，增加用户黏性，提升产品价值。
Competitors：与竞品相比，具有更高的推荐精准度和更强的个性化定制能力。
Delivery：通过高效的团队配置和项目管理，确保功能按时交付。

2.团队角色配置

考虑到有6个人和4个月的时间，以及需要如期发布软件的改进版本，以下是一个建议的团队角色配置：

项目经理：1人，负责整体项目规划、进度控制和风险管理。
开发人员：3人，负责新功能的设计、编码和调试。
测试人员：1人，负责对新功能进行详细的测试，确保质量和稳定性。
美工/UI设计师：1人，负责设计界面和优化用户体验。

3.16周期每周详细规划

时间	阶段	分工
第1-2周	需求分析与设计阶段	项目经理：制定项目计划，明确功能需求和目标。开发人员：进行技术调研和预研，准备开发环境。美工/UI设计师：设计界面原型，与项目经理和开发人员讨论确认。
第3-4周	开发前期准备与基础功能实现	开发人员：开始编写核心代码，实现基本功能。测试人员：编写测试用例，准备测试环境。美工/UI设计师：完善界面设计，提供设计素材。
第5-8周	功能开发与单元测试	开发人员：继续开发，进行功能模块的集成和调试。测试人员：对新开发的功能进行初步测试，反馈问题。美工/UI设计师：根据开发进度，调整界面设计。
第9-12周	集成测试与性能优化	开发人员：修复测试中发现的问题，优化性能。测试人员：进行全面、详细的测试，确保功能稳定。美工/UI设计师：完成界面设计，与开发人员对接。
第13-14周	用户验收测试与反馈调整	开发人员：与美工/UI设计师合作，将界面设计整合到产品中。测试人员：进行界面和功能的联合测试。项目经理：协调各方资源，确保项目按计划进行。
第15周	文档编写与发布准备	开发人员：进行最后的优化和调试，准备发布。测试人员：进行最终验收测试，确保无重大问题。美工/UI设计师：完善用户手册和教程。
第16周	软件发布与后期跟踪	项目经理：组织发布会议，发布软件的改进版本。团队全体成员：总结项目经验，为下一阶段的工作做准备。