作业基本信息
这个作业属于哪个课程 | 软件工程实践-2023学年-W班 |
---|---|
这个作业要求在哪里 | 软件工程实践——软件评测作业 |
这个作业的目标 | 通过各种案例分析,评测,思辨,总结,我们就能看到软件工程的原则在实践中的种种体现, 学好软件工程,帮助我们在实践中做得更好。 |
其他参考文献 | 软件工程 案例分析作业 |
文章目录
第一部分 调研,评测
文心一言
体验
1. 功能介绍
1.1 问答
用户使用对话框输入内容与大语言模型直接对话,大语言模型给出对应的回答
包括纯语言回答和图片回答
配合插件可以专注回答,强化对应能力,包括解析文档和图片
1.2 百宝箱
帮助用户创建场景问题,生成要求
2. 优缺点分析
优点:
1.准确度是国内环境下最强的大语言模型,使用方便,其回答在大部分领域较浅层时可以提供相对准确的答案。
2.功能性方面,各式插件提供了哪怕gpt4都不能给予的优秀体验,在处理问题的方向上集成度高,方便一站式使用
缺点:
1.数据量不足,与最优秀的大语言模型仍有一定差距,时常让人感到不够“智能”,撞入死胡同后无法自我纠正,也无法根据用户提示纠正。
2.ui界面较差,不符合ai高智能的风格,页面逻辑较差,有点像随便找个人来设计的
3. 改进意见
继续优化模型算法,增加服务器算力,继续强化核心功能
4. 用户意见
采访对象
学号——222100213
背景——同宿舍舍友,平常使用ai不多。
记录
栏目——逻辑问答模块
问题——让文心一言进行逻辑问答时,即使问题本身出错,也会给出信誓旦旦的结论,出现明显的逻辑错误,并不能自知。
改进——继续优化
BUG
测试环境
操作系统——Windows 10 家庭中文版 22H2
操作系统内部版本——19045.4170
浏览器——Chrome
浏览器版本——123.0.6312.88 (正式版本) (64 位) (cohort: Stable)
BUG描述
可复现性——有几率
复现操作——在任意一个问题,在回答还没生成完毕时,切换到历史记录中。反复切换几次后,回答不再生成,画面卡住,有时中断
BUG严重性 ★☆☆☆☆
系统功能——影响了会话间的自如切换功能,但这是极限场景,一般使用中较难复现
安全问题——几乎不影响用户信息,服务器信息等安全性问题
用户体验——影响喜欢反复切屏的用户,导致回答生成卡断,影响体验
BUG分析
可能成因——每次处理对话可能都被视为一次用户发起的请求,在生成过程中切换对话,服务端可能为节省资源,就中断了这次请求,反复切换后,服务端视此为异常请求次数,暂时中断此对话
预期和改进——放宽对单位时间内对请求数的限制,不至于影响到个人用户的体验
结论
好,不错
可圈可点,尤其是笔者使用半年来模型效果进步喜人,未来可期
通义千问
体验
1. 功能介绍
1.1 问答
用户使用对话框输入内容与大语言模型直接对话,大语言模型给出对应的回答
包括了纯语言回答和图片回答
配合插件可以专注回答,强化对应能力
1.2 百宝袋
基本是对标了文心一言的百宝箱,但界面逻辑更为清晰,不像文心一言直接粗暴生成对应的提问,而是在新界面提示关键词
2. 优缺点分析
优点:
1.准确度略逊于文心一言,使用方便,其回答在大部分领域较浅层时也可以提供相对准确的答案。
2.ui界面较佳,符合ai高智能的风格,简约时尚,页面逻辑佳。
3.功能性方面,功能相对文心一言较少。
缺点:
1.数据量不足,与最优秀的大语言模型仍有一定差距。
2.生成速度较慢
3. 改进意见
继续优化模型算法,增加服务器算力,继续强化核心功能
4. 用户意见
采访对象
学号——222100215
背景——同班同学,平常基本没有接触AI文本大模型。
记录
栏目——事实问题问答模块
问题——让文心一言进行事实问答时,如果数据未及时更新,很可能给出错误的结论。
改进——继续优化
BUG
测试环境
操作系统——Windows 10 家庭中文版 22H2
操作系统内部版本——19045.4170
浏览器——Chrome
浏览器版本——123.0.6312.88 (正式版本) (64 位) (cohort: Stable)
BUG描述
可复现性——必然发生
复现操作——在通义千问的图片描述功能中,在上传完图片并给出要求后,在文本未生成完毕时刷新页面,再提交问题,停止回答
BUG严重性 ★★★★☆
系统功能——极大影响了用户使用体验
安全问题——几乎不影响用户信息,服务器信息等安全性问题
用户体验——影响喜欢反复刷新的用户,导致回答生成卡断,影响体验
BUG分析
可能成因——每次处理对话可能都被视为一次用户发起的请求,在生成过程中切换对话,服务端可能为节省资源,就中断了这次请求,反复切换后,服务端视此为异常请求次数,暂时中断此对话
预期和改进——放宽对单位时间内对请求数的限制,不至于影响到个人用户的体验
结论
文本问答模块设计优秀,百宝箱中的工具实用,ui不错,在持续加强模型能力后未来可期
第二部分 分析
开发时间估计
软件名称 | 功能模块 | 预估时间 |
---|---|---|
文心一言 | 大模型3.5版与4.0版、百宝箱、图像文件识别 | 610天 |
通义千问 | 大模型、百宝袋、图像文件识别,文档文件识别 | 410天 |
同类产品对比排名
对比排名 | 1 | 2 |
---|---|---|
界面设计 | 通义千问 | 文心一言 |
功能性 | 文心一言 | 通义千问 |
准确性 | 文心一言 | 通义千问 |
数据量 | 文心一言 | 通义千问 |
软件工程方面的建议?
软件名称 | 建议 |
---|---|
通义千问 | 1. 优化生成速度。 2 解决BUG,解决刷新页面会出现的BUG。 |
文心一言 | 1… 优化AI逻辑,强化自我纠错功能。 2. 界面优化,界面太丑太丑了,应该设计成简约高级的风格,而不是到处打广告升级vip,土到家。 3. 优化文生图模块,别总是闹出“车水马龙”的笑话。 |
第三部分 建议和规划
市场概况
1.1、市场大小
IDC于近日发布了2023年V2版IDC《全球人工智能支出指南》(IDC Worldwide Artificial Intelligence Spending Guide)。IDC最新数据显示,2022年全球人工智能IT总投资规模为1,288亿美元,2027年预计增至4,236亿美元,五年复合增长率(CAGR)约为26.9%。IDC预计,2027年中国AI投资规模有望达到381亿美元,全球占比约9%。
1.2、直接用户和潜在用户
直接用户:
内容创作者:如作家、记者、编辑、广告文案人员等,他们可以利用生成式AI快速生成文章、故事、广告文案等内容,提高创作效率和质量。
设计师:生成式AI可以辅助设计师生成图像、图标、UI设计等,为设计师提供灵感和创意支持。
程序员和开发者:他们可以借助生成式AI生成代码片段或进行自动化测试,减轻开发负担,加速软件开发进程。
市场营销人员:利用生成式AI进行市场调研、生成营销策略、制定推广计划等,提高市场营销效果。
潜在用户:
学生和教育工作者:学生可以利用生成式AI辅助学习,如生成学习资料、进行论文写作等;教育工作者则可以利用其进行智能教学、制定教学计划等。
普通网民:在日常生活中,人们可以利用生成式AI进行个性化的内容推荐、生成趣味图片、制作短视频等,提升用户体验。
科研人员和学者:他们可以借助生成式AI进行科学研究、数据分析、论文撰写等,推动科研进展。
商业企业和组织:各种规模的企业和组织都可以利用生成式AI提高工作效率,优化业务流程,创造新的商业价值。## 市场现状
市场现状
现有产品
目前市场上已经涌现出大量的生成式AI产品,这些产品覆盖了文本、图像、音频、视频等多个领域。具体来说,有像ChatGPT这样的文本生成工具,能够基于用户输入生成连贯的文本内容;还有像DALL-E这样的图像生成工具,能够根据文字描述生成对应的图像;此外视频生成工具sora,可以自动生成视频片段,等等。
上述产品的定位、优势与劣势:
定位:
这些生成式AI产品的定位各不相同,但总体上都是为了提高工作效率和创意性。例如,ChatGPT定位为辅助写作和对话的工具,可以帮助用户快速生成文案和回答问题。
优势:
它们的优势在于能够自动化完成大量重复性和劳动密集型的任务,使用户能够集中精力于更具创新性和策略性的工作。同时,生成式AI产品还能提供个性化的体验,如个性化推荐、定制化新闻等,从而增强用户体验和满意度。
劣势:
然而,这些产品也存在一些劣势。例如,由于技术限制,生成的内容可能在某些情况下缺乏准确性和深度,无法完全替代人类的专业工作。此外,生成式AI产品也可能面临数据安全和隐私保护的问题,需要在使用过程中加以注意。
上述产品之间呈现什么样的关系,哪些为竞品关系?以及竞争中的各方态势如何?
这些生成式AI产品之间存在一定的互补关系,它们共同构成了一个多元化的生成式AI生态。然而,在某些领域,如文本生成和图像生成,也存在竞品关系。竞品之间会通过不断提升技术水平、优化用户体验、拓展应用场景等方式来争夺市场份额。
在竞争中,各方态势因产品特性、市场定位、用户反馈等多种因素而有所不同。一些具有独特优势和创新点的产品可能在市场上脱颖而出,而一些缺乏核心竞争力的产品则可能面临被边缘化的风险。
这个领域正处于什么阶段?
目前,生成式AI领域正处于快速成长阶段。随着技术的不断进步和应用场景的不断拓宽,生成式AI产品在各个领域都得到了广泛的应用和认可。未来,随着算法的优化、算力的提升以及数据资源的丰富,生成式AI领域有望继续保持快速发展的态势,为各行各业带来更多的创新和变革。
市场与产品生态
1.核心用户群及典型用户分析
核心用户群主要是那些对生成式AI技术有浓厚兴趣,并且愿意在实际工作、学习或生活中尝试和应用的人群。他们通常具备以下特征:
学历:一般拥有较高学历,如本科及以上,对新技术有一定的接受能力和学习欲望。
年龄:集中在25至45岁之间,这一年龄段的人群既有一定的社会经验,又具备对新技术的探索和学习能力。
专业:可能涵盖多个领域,包括但不限于计算机科学、艺术设计、媒体传播等,因为这些专业背景的人群更有可能在工作中使用到生成式AI技术。
爱好:对科技创新、艺术设计、内容创作等方面有着浓厚兴趣,喜欢尝试新事物,追求效率与创意的结合。
收入:中高收入水平,因为生成式AI产品可能涉及一定的成本,包括学习成本和使用成本。
表面需求:用户希望产品能够简单、高效地完成内容生成任务,如文本创作、图像处理、视频编辑等。
潜在需求:用户期望产品能够提供更多个性化、定制化的服务,满足其特定场景下的需求,同时希望产品能够不断更新迭代,提供更多新颖、有趣的功能。
典型用户可能是一位设计师,他利用生成式AI产品快速生成设计草图,提高工作效率;或者是一位内容创作者,他借助产品生成文章或故事,丰富自己的创作素材。
2.用户群体间的关系与生态构建
产品的用户群体之间存在一定的联系和互动。例如,设计师和内容创作者可能会互相交流使用心得,分享生成的优质内容,从而形成一个基于产品的社区或社群。这种社群效应有助于增强用户的粘性和忠诚度,同时也有利于产品的推广和口碑传播。
利用用户间的相互作用,可以二次构成特定用户生态。例如,通过举办线上或线下的交流活动,促进用户之间的合作与共创,形成更加紧密的用户群体。此外,还可以根据用户反馈和需求,不断优化产品功能和用户体验,打造更加符合用户需求的产品生态。
3.子产品及相关产品间的关系与生态构建
产品的子产品和其他相关产品之间通常存在互补或协同的关系。例如,一个生成式AI产品可能包括文本生成、图像生成、语音合成等多个子产品,这些子产品可以单独使用,也可以结合使用,为用户提供更加全面和便捷的服务。
利用各个产品特性之间的相互关系,可以二次构成产品生态。例如,通过整合不同子产品的功能,打造一站式的内容生成平台,满足用户在不同场景下的需求。同时,还可以与其他相关产品进行合作,如与社交媒体平台合作,实现内容的一键分享和推广,从而扩大产品的影响力和市场份额。
产品规划
1.新功能设计
功能名称:智能内容推荐与个性化定制
设计原因:
1.1 市场需求:随着个性化服务的兴起,用户越来越期望获得符合自己兴趣和需求的内容。
1.2 用户体验提升:通过智能推荐,可以减少用户搜索和筛选内容的时间,提高使用效率。
1.3 竞争优势:当前市场上的竞品主要集中在内容生成上,智能推荐和个性化定制能够形成差异化的竞争优势。
1.4 用户吸引力:用户会使用此功能,因为它能够根据用户的历史行为和偏好,为其推荐相关内容,使得每次使用都能得到个性化、定制化的体验,增加用户的黏性和满意度。
创新点:
算法创新:采用先进的深度学习算法,结合用户画像和内容特征,实现精准推荐。
交互创新:设计简洁直观的交互界面,允许用户自定义推荐规则,满足多样化的需求。
NABCD分析:
Need:满足用户对个性化内容的需求。
Approach:通过算法优化和界面设计,实现个性化推荐功能。
Benefit:提高用户体验,增加用户黏性,提升产品价值。
Competitors:与竞品相比,具有更高的推荐精准度和更强的个性化定制能力。
Delivery:通过高效的团队配置和项目管理,确保功能按时交付。
2.团队角色配置
考虑到有6个人和4个月的时间,以及需要如期发布软件的改进版本,以下是一个建议的团队角色配置:
项目经理:1人,负责整体项目规划、进度控制和风险管理。
开发人员:3人,负责新功能的设计、编码和调试。
测试人员:1人,负责对新功能进行详细的测试,确保质量和稳定性。
美工/UI设计师:1人,负责设计界面和优化用户体验。
3.16周期每周详细规划
时间 | 阶段 | 分工 |
---|---|---|
第1-2周 | 需求分析与设计阶段 | 项目经理:制定项目计划,明确功能需求和目标。 开发人员:进行技术调研和预研,准备开发环境。 美工/UI设计师:设计界面原型,与项目经理和开发人员讨论确认。 |
第3-4周 | 开发前期准备与基础功能实现 | 开发人员:开始编写核心代码,实现基本功能。 测试人员:编写测试用例,准备测试环境。 美工/UI设计师:完善界面设计,提供设计素材。 |
第5-8周 | 功能开发与单元测试 | 开发人员:继续开发,进行功能模块的集成和调试。 测试人员:对新开发的功能进行初步测试,反馈问题。 美工/UI设计师:根据开发进度,调整界面设计。 |
第9-12周 | 集成测试与性能优化 | 开发人员:修复测试中发现的问题,优化性能。 测试人员:进行全面、详细的测试,确保功能稳定。 美工/UI设计师:完成界面设计,与开发人员对接。 |
第13-14周 | 用户验收测试与反馈调整 | 开发人员:与美工/UI设计师合作,将界面设计整合到产品中。 测试人员:进行界面和功能的联合测试。 项目经理:协调各方资源,确保项目按计划进行。 |
第15周 | 文档编写与发布准备 | 开发人员:进行最后的优化和调试,准备发布。 测试人员:进行最终验收测试,确保无重大问题。 美工/UI设计师:完善用户手册和教程。 |
第16周 | 软件发布与后期跟踪 | 项目经理:组织发布会议,发布软件的改进版本。 团队全体成员:总结项目经验,为下一阶段的工作做准备。 |