软件工程实践——软件评测作业

本文详细评测了文心一言和通义千问在功能、优缺点、用户体验和开发时间等方面的性能,并给出了软件工程实践课程中的市场分析和改进建议,包括优化AI逻辑、界面设计和解决bug等问题。
摘要由CSDN通过智能技术生成

作业基本信息

这个作业属于哪个课程软件工程实践-2023学年-W班
这个作业要求在哪里软件工程实践——软件评测作业
这个作业的目标通过各种案例分析,评测,思辨,总结,我们就能看到软件工程的原则在实践中的种种体现,
学好软件工程,帮助我们在实践中做得更好。
其他参考文献软件工程 案例分析作业

第一部分 调研,评测

文心一言

体验

1. 功能介绍

1.1 问答

用户使用对话框输入内容与大语言模型直接对话,大语言模型给出对应的回答
包括纯语言回答和图片回答
配合插件可以专注回答,强化对应能力,包括解析文档和图片

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

1.2 百宝箱

帮助用户创建场景问题,生成要求

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

2. 优缺点分析

优点:
1.准确度是国内环境下最强的大语言模型,使用方便,其回答在大部分领域较浅层时可以提供相对准确的答案。
2.功能性方面,各式插件提供了哪怕gpt4都不能给予的优秀体验,在处理问题的方向上集成度高,方便一站式使用

缺点:
1.数据量不足,与最优秀的大语言模型仍有一定差距,时常让人感到不够“智能”,撞入死胡同后无法自我纠正,也无法根据用户提示纠正。
2.ui界面较差,不符合ai高智能的风格,页面逻辑较差,有点像随便找个人来设计的

在这里插入图片描述

3. 改进意见

继续优化模型算法,增加服务器算力,继续强化核心功能

4. 用户意见

采访对象
学号——222100213
背景——同宿舍舍友,平常使用ai不多。

记录
栏目——逻辑问答模块
问题——让文心一言进行逻辑问答时,即使问题本身出错,也会给出信誓旦旦的结论,出现明显的逻辑错误,并不能自知。
改进——继续优化

BUG

测试环境
操作系统——Windows 10 家庭中文版 22H2
操作系统内部版本——19045.4170
浏览器——Chrome
浏览器版本——123.0.6312.88 (正式版本) (64 位) (cohort: Stable)

BUG描述
可复现性——有几率
复现操作——在任意一个问题,在回答还没生成完毕时,切换到历史记录中。反复切换几次后,回答不再生成,画面卡住,有时中断

在这里插入图片描述

在这里插入图片描述

BUG严重性 ★☆☆☆☆
系统功能——影响了会话间的自如切换功能,但这是极限场景,一般使用中较难复现
安全问题——几乎不影响用户信息,服务器信息等安全性问题
用户体验——影响喜欢反复切屏的用户,导致回答生成卡断,影响体验

BUG分析
可能成因——每次处理对话可能都被视为一次用户发起的请求,在生成过程中切换对话,服务端可能为节省资源,就中断了这次请求,反复切换后,服务端视此为异常请求次数,暂时中断此对话
预期和改进——放宽对单位时间内对请求数的限制,不至于影响到个人用户的体验

结论

好,不错
可圈可点,尤其是笔者使用半年来模型效果进步喜人,未来可期

通义千问

体验

1. 功能介绍

1.1 问答

用户使用对话框输入内容与大语言模型直接对话,大语言模型给出对应的回答
包括了纯语言回答和图片回答
配合插件可以专注回答,强化对应能力

在这里插入图片描述

1.2 百宝袋

基本是对标了文心一言的百宝箱,但界面逻辑更为清晰,不像文心一言直接粗暴生成对应的提问,而是在新界面提示关键词

在这里插入图片描述

2. 优缺点分析

优点:
1.准确度略逊于文心一言,使用方便,其回答在大部分领域较浅层时也可以提供相对准确的答案。
2.ui界面较佳,符合ai高智能的风格,简约时尚,页面逻辑佳。
3.功能性方面,功能相对文心一言较少。

缺点:
1.数据量不足,与最优秀的大语言模型仍有一定差距。
2.生成速度较慢

3. 改进意见

继续优化模型算法,增加服务器算力,继续强化核心功能

4. 用户意见

采访对象
学号——222100215
背景——同班同学,平常基本没有接触AI文本大模型。

记录
栏目——事实问题问答模块
问题——让文心一言进行事实问答时,如果数据未及时更新,很可能给出错误的结论。
改进——继续优化
在这里插入图片描述

BUG

测试环境
操作系统——Windows 10 家庭中文版 22H2
操作系统内部版本——19045.4170
浏览器——Chrome
浏览器版本——123.0.6312.88 (正式版本) (64 位) (cohort: Stable)

BUG描述
可复现性——必然发生
复现操作——在通义千问的图片描述功能中,在上传完图片并给出要求后,在文本未生成完毕时刷新页面,再提交问题,停止回答

在这里插入图片描述

BUG严重性 ★★★★☆
系统功能——极大影响了用户使用体验
安全问题——几乎不影响用户信息,服务器信息等安全性问题
用户体验——影响喜欢反复刷新的用户,导致回答生成卡断,影响体验

BUG分析
可能成因——每次处理对话可能都被视为一次用户发起的请求,在生成过程中切换对话,服务端可能为节省资源,就中断了这次请求,反复切换后,服务端视此为异常请求次数,暂时中断此对话
预期和改进——放宽对单位时间内对请求数的限制,不至于影响到个人用户的体验

结论

文本问答模块设计优秀,百宝箱中的工具实用,ui不错,在持续加强模型能力后未来可期

第二部分 分析

开发时间估计

软件名称功能模块预估时间
文心一言大模型3.5版与4.0版、百宝箱、图像文件识别610天
通义千问大模型、百宝袋、图像文件识别,文档文件识别410天

同类产品对比排名

对比排名12
界面设计通义千问文心一言
功能性文心一言通义千问
准确性文心一言通义千问
数据量文心一言通义千问

软件工程方面的建议?

软件名称建议
通义千问1. 优化生成速度。
2 解决BUG,解决刷新页面会出现的BUG。
文心一言1… 优化AI逻辑,强化自我纠错功能。
2. 界面优化,界面太丑太丑了,应该设计成简约高级的风格,而不是到处打广告升级vip,土到家。
3. 优化文生图模块,别总是闹出“车水马龙”的笑话。

第三部分 建议和规划

市场概况

1.1、市场大小

IDC于近日发布了2023年V2版IDC《全球人工智能支出指南》(IDC Worldwide Artificial Intelligence Spending Guide)。IDC最新数据显示,2022年全球人工智能IT总投资规模为1,288亿美元,2027年预计增至4,236亿美元,五年复合增长率(CAGR)约为26.9%。IDC预计,2027年中国AI投资规模有望达到381亿美元,全球占比约9%。

1.2、直接用户和潜在用户

直接用户
内容创作者:如作家、记者、编辑、广告文案人员等,他们可以利用生成式AI快速生成文章、故事、广告文案等内容,提高创作效率和质量。
设计师:生成式AI可以辅助设计师生成图像、图标、UI设计等,为设计师提供灵感和创意支持。
程序员和开发者:他们可以借助生成式AI生成代码片段或进行自动化测试,减轻开发负担,加速软件开发进程。
市场营销人员:利用生成式AI进行市场调研、生成营销策略、制定推广计划等,提高市场营销效果。

潜在用户
学生和教育工作者:学生可以利用生成式AI辅助学习,如生成学习资料、进行论文写作等;教育工作者则可以利用其进行智能教学、制定教学计划等。
普通网民:在日常生活中,人们可以利用生成式AI进行个性化的内容推荐、生成趣味图片、制作短视频等,提升用户体验。
科研人员和学者:他们可以借助生成式AI进行科学研究、数据分析、论文撰写等,推动科研进展。
商业企业和组织:各种规模的企业和组织都可以利用生成式AI提高工作效率,优化业务流程,创造新的商业价值。## 市场现状

市场现状

现有产品

目前市场上已经涌现出大量的生成式AI产品,这些产品覆盖了文本、图像、音频、视频等多个领域。具体来说,有像ChatGPT这样的文本生成工具,能够基于用户输入生成连贯的文本内容;还有像DALL-E这样的图像生成工具,能够根据文字描述生成对应的图像;此外视频生成工具sora,可以自动生成视频片段,等等。

上述产品的定位、优势与劣势:

定位:
这些生成式AI产品的定位各不相同,但总体上都是为了提高工作效率和创意性。例如,ChatGPT定位为辅助写作和对话的工具,可以帮助用户快速生成文案和回答问题。

优势:
它们的优势在于能够自动化完成大量重复性和劳动密集型的任务,使用户能够集中精力于更具创新性和策略性的工作。同时,生成式AI产品还能提供个性化的体验,如个性化推荐、定制化新闻等,从而增强用户体验和满意度。

劣势:
然而,这些产品也存在一些劣势。例如,由于技术限制,生成的内容可能在某些情况下缺乏准确性和深度,无法完全替代人类的专业工作。此外,生成式AI产品也可能面临数据安全和隐私保护的问题,需要在使用过程中加以注意。

上述产品之间呈现什么样的关系,哪些为竞品关系?以及竞争中的各方态势如何?

这些生成式AI产品之间存在一定的互补关系,它们共同构成了一个多元化的生成式AI生态。然而,在某些领域,如文本生成和图像生成,也存在竞品关系。竞品之间会通过不断提升技术水平、优化用户体验、拓展应用场景等方式来争夺市场份额。

在竞争中,各方态势因产品特性、市场定位、用户反馈等多种因素而有所不同。一些具有独特优势和创新点的产品可能在市场上脱颖而出,而一些缺乏核心竞争力的产品则可能面临被边缘化的风险。

这个领域正处于什么阶段?

目前,生成式AI领域正处于快速成长阶段。随着技术的不断进步和应用场景的不断拓宽,生成式AI产品在各个领域都得到了广泛的应用和认可。未来,随着算法的优化、算力的提升以及数据资源的丰富,生成式AI领域有望继续保持快速发展的态势,为各行各业带来更多的创新和变革。

市场与产品生态

1.核心用户群及典型用户分析

核心用户群主要是那些对生成式AI技术有浓厚兴趣,并且愿意在实际工作、学习或生活中尝试和应用的人群。他们通常具备以下特征:
学历:一般拥有较高学历,如本科及以上,对新技术有一定的接受能力和学习欲望。
年龄:集中在25至45岁之间,这一年龄段的人群既有一定的社会经验,又具备对新技术的探索和学习能力。
专业:可能涵盖多个领域,包括但不限于计算机科学、艺术设计、媒体传播等,因为这些专业背景的人群更有可能在工作中使用到生成式AI技术。
爱好:对科技创新、艺术设计、内容创作等方面有着浓厚兴趣,喜欢尝试新事物,追求效率与创意的结合。
收入:中高收入水平,因为生成式AI产品可能涉及一定的成本,包括学习成本和使用成本。
表面需求:用户希望产品能够简单、高效地完成内容生成任务,如文本创作、图像处理、视频编辑等。
潜在需求:用户期望产品能够提供更多个性化、定制化的服务,满足其特定场景下的需求,同时希望产品能够不断更新迭代,提供更多新颖、有趣的功能。

典型用户可能是一位设计师,他利用生成式AI产品快速生成设计草图,提高工作效率;或者是一位内容创作者,他借助产品生成文章或故事,丰富自己的创作素材。

2.用户群体间的关系与生态构建

产品的用户群体之间存在一定的联系和互动。例如,设计师和内容创作者可能会互相交流使用心得,分享生成的优质内容,从而形成一个基于产品的社区或社群。这种社群效应有助于增强用户的粘性和忠诚度,同时也有利于产品的推广和口碑传播。

利用用户间的相互作用,可以二次构成特定用户生态。例如,通过举办线上或线下的交流活动,促进用户之间的合作与共创,形成更加紧密的用户群体。此外,还可以根据用户反馈和需求,不断优化产品功能和用户体验,打造更加符合用户需求的产品生态。

3.子产品及相关产品间的关系与生态构建

产品的子产品和其他相关产品之间通常存在互补或协同的关系。例如,一个生成式AI产品可能包括文本生成、图像生成、语音合成等多个子产品,这些子产品可以单独使用,也可以结合使用,为用户提供更加全面和便捷的服务。

利用各个产品特性之间的相互关系,可以二次构成产品生态。例如,通过整合不同子产品的功能,打造一站式的内容生成平台,满足用户在不同场景下的需求。同时,还可以与其他相关产品进行合作,如与社交媒体平台合作,实现内容的一键分享和推广,从而扩大产品的影响力和市场份额。

产品规划

1.新功能设计

功能名称:智能内容推荐与个性化定制

设计原因

1.1 市场需求:随着个性化服务的兴起,用户越来越期望获得符合自己兴趣和需求的内容。
1.2 用户体验提升:通过智能推荐,可以减少用户搜索和筛选内容的时间,提高使用效率。
1.3 竞争优势:当前市场上的竞品主要集中在内容生成上,智能推荐和个性化定制能够形成差异化的竞争优势。
1.4 用户吸引力:用户会使用此功能,因为它能够根据用户的历史行为和偏好,为其推荐相关内容,使得每次使用都能得到个性化、定制化的体验,增加用户的黏性和满意度。

创新点

算法创新:采用先进的深度学习算法,结合用户画像和内容特征,实现精准推荐。

交互创新:设计简洁直观的交互界面,允许用户自定义推荐规则,满足多样化的需求。

NABCD分析

Need:满足用户对个性化内容的需求。
Approach:通过算法优化和界面设计,实现个性化推荐功能。
Benefit:提高用户体验,增加用户黏性,提升产品价值。
Competitors:与竞品相比,具有更高的推荐精准度和更强的个性化定制能力。
Delivery:通过高效的团队配置和项目管理,确保功能按时交付。

2.团队角色配置

考虑到有6个人和4个月的时间,以及需要如期发布软件的改进版本,以下是一个建议的团队角色配置:

项目经理:1人,负责整体项目规划、进度控制和风险管理。
开发人员:3人,负责新功能的设计、编码和调试。
测试人员:1人,负责对新功能进行详细的测试,确保质量和稳定性。
美工/UI设计师:1人,负责设计界面和优化用户体验。

3.16周期每周详细规划

时间阶段分工
第1-2周需求分析与设计阶段项目经理:制定项目计划,明确功能需求和目标。
开发人员:进行技术调研和预研,准备开发环境。
美工/UI设计师:设计界面原型,与项目经理和开发人员讨论确认。
第3-4周开发前期准备与基础功能实现开发人员:开始编写核心代码,实现基本功能。
测试人员:编写测试用例,准备测试环境。
美工/UI设计师:完善界面设计,提供设计素材。
第5-8周功能开发与单元测试开发人员:继续开发,进行功能模块的集成和调试。
测试人员:对新开发的功能进行初步测试,反馈问题。
美工/UI设计师:根据开发进度,调整界面设计。
第9-12周集成测试与性能优化开发人员:修复测试中发现的问题,优化性能。
测试人员:进行全面、详细的测试,确保功能稳定。
美工/UI设计师:完成界面设计,与开发人员对接。
第13-14周用户验收测试与反馈调整开发人员:与美工/UI设计师合作,将界面设计整合到产品中。
测试人员:进行界面和功能的联合测试。
项目经理:协调各方资源,确保项目按计划进行。
第15周文档编写与发布准备开发人员:进行最后的优化和调试,准备发布。
测试人员:进行最终验收测试,确保无重大问题。
美工/UI设计师:完善用户手册和教程。
第16周软件发布与后期跟踪项目经理:组织发布会议,发布软件的改进版本。
团队全体成员:总结项目经验,为下一阶段的工作做准备。
  • 52
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值