这个作业属于哪个课程 | 软件工程实践-2023学年-W班 |
---|---|
这个作业要求在哪里 | 软件工程实践——软件评测作业 |
这个作业的目标 | 软件评测,撰写博客 |
其他参考文献 | 《构建之法》 |
案例分析作业要求
第一部分 调研、评测
测试环境
- 操作系统: Windows 11 家庭中文版 版本 23H2(操作系统版本:22631.3447)
- 浏览器: Microsoft Edge 版本 123.0.2420.81 (正式版本) (64 位)
BUG指标量化标准
星级 | 说明 |
---|---|
⭐ | 对用户使用没有影响,但是不符合用户期望,比如UI界面显示问题 |
⭐⭐ | 对用户有轻度影响,但使用的频率较低,不发生在核心功能;或是交互逻辑存在问题 |
⭐⭐⭐ | 对用户使用有较明显的影响;或是出现频率较频繁,影响用户的正常使用 |
⭐⭐⭐⭐ | 对用户使用有较大的影响,核心功能无法正常使用,程序异常崩溃等 |
⭐⭐⭐⭐⭐ | 若不修复会导致用户无法正常使用,比如数据不同步、安全性漏洞等致命BUG |
软件质量量化标准
评价 | 分数段 |
---|---|
非常不推荐 | 0 ~ 60 |
不推荐 | 60 ~ 70 |
一般 | 70 ~ 80 |
推荐 | 80 ~ 90 |
非常推荐 | 90 ~ 100 |
1、文心一言
1.1 体验
1.1.1 介绍和使用
文心一言是百度研发的产业级知识增强大模型,由文心大模型驱动,具备理解、生成、逻辑、记忆四大基础能力。文心一言包含基础通用的大模型,也包含面向重点任务领域和行业的大模型,以及丰富的工具与平台,支撑企业与开发者进行高效便捷的应用开发。文心一言能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言具有以下五大应用场景:学习成长、休闲娱乐、职场提效、情感陪伴、生活助手。
-
主页,左侧是功能区,可以进行新建对话,打开百宝箱,浏览使用文档等,下方是提问区域,输入内容即可提问
-
百宝箱窗口,这里提供了许多预设好的问题模板
-
代码生成功能体验
-
绘图功能体验
1.1.2 优缺点分析
-
优点:
- 界面做了屏幕尺寸适配,可以根据用户设备的屏幕大小自动适配页面布局。
- 在回答的末尾给出了参考资料,可以自动链接到相应的百度百科供用户进一步了解(特色)。
- 用户对回答不满意可以重新生成,并且会记录每一次的回答(至多五次)。
- 回答结束后,会对用户接下来可能提出的问题进行推测,可以帮助用户更好的提问以及解决问题。
- 左侧功能区可以根据用户需求自由选择展开和折叠,可以帮助用户更好地沉浸在工作中。
- 可以上传图片和文档进行分析
- 可以把回答直接复制为markdown格式。
- 有使用教程和文档。
- 可以根据名称对对话进行搜索,当会话数目较多时可以快速找到需要的会话,可以批量删除对话。
-
缺点:
- 对回答中的重点信息或关键词没有加粗进行突出显示。
- 会员开通的广告常驻,并且显示效果格外突出,会给用户带来不好的感受和体验。
- 百宝箱加载较卡顿,并且功能比较鸡肋。
1.1.3 用户意见
- 输入框文本限制,长度限制为2000个汉字,但是一个空格或者一个字母长度也算一个,这就导致无法输入较长的问题或进行大量文本数据的输入解析。而大模型的输入限制其实是计算tokens的,这样粗暴的限制长度是偷懒的行为,希望可以对输入逻辑进行优化。
- 画图功能较差,生成的图片都有AI生成的水印,并且很多图片类型不能生成,希望可以再进行进一步的训练。
- 回答的生成速度比较慢,可以考虑优化一下。
1.1.4 用户采访
- 背景: 福州大学软件工程专业的大三学生
- 需求: 可以根据文字描述生成相应的代码示例、可以对提出的编程领域的问题给出针对性的正确答案
- 使用的产品栏目: 编程辅助、功能写作、绘画达人
- 问题和亮点: 在编程问题上表现的还不错,给出的示例代码比较完整,还带有注释和注意事项,但是在写作和绘图上表现就一般般,不过绘图速度很快
- 需要改进的地方: 在绘图方面可能还需要进一步的训练,目前的效果并不是很理想
1.2 BUG
1.2.1 BUG-1
1.2.1.1 可复现性及具体复现步骤
-
可复现性: 特定条件下必然发生
-
复现步骤:
打开文心一言的百宝箱功能,在弹出窗口的搜索框中搜索c+++…(3个及以上任意多个+)或C+++…(3个及以上任意多个+),然后将加号删除至只剩两个,如C++/c++。
1.2.1.2 具体情况描述
-
描述:
按照上述复现步骤进行操作后,可以发现此时关键词有符合的搜索结果,但是搜索结果呈现出了不正常的空白状态(正常情况下如果结果存在,会将结果显示,结果不存在则会给出没有结果的提示),而不是显示搜索到的正确的结果。
-
展示:
1.2.1.3 BUG分析
-
成因:
这个BUG产生的原因可能是搜索内容意外触发了预设正则表达式中的某些特殊规则,导致进行匹配时出现错误,服务器返回了错误的JSON数据,这些错误的JSON数据无法在前端容器中正常显示,所以出现了空白的情况。
-
严重性: ⭐
针对特定的搜索内容会发生,暂时没有发现除此特例之外的其他类似搜索内容出现该现象,对用户使用影响较小。
-
预期和改进建议:
预期中搜索内容应该正确出现,即使没有符合搜索条件的内容也应该给出没有相应内容的提示,而不是显示空白,这显然是一个BUG,可以对正则表达式规则进行检查,寻找导致这个BUG的真实原因。
1.2.2 BUG-2
1.2.2.1 可复现性及具体复现步骤
-
可复现性: 必然发生
-
复现步骤:
与文心一言大模型进行任意对话,在回答生成期间点击新建对话或是切换到别的对话,再返回之前的对话。
1.2.2.2 具体情况描述
-
描述:
按照上述复现步骤进行操作后,可以发现此时大模型的回答会发生卡顿而无法继续完成回答结果的生成,但是会将已经生成的部分内容显示出来,重新生成则可顺利生成该问题的回答。
-
展示:
1.2.2.3 BUG分析
-
成因:
这个BUG发生的原因可能是一个页面只支持一个对话(一个回答)的连接与进行,比如我们可以很容易的发现,只要我们把网站切换到后台,大模型的回答就会暂停生成,再次切换回来就会继续生成,这就说明连接被暂时挂起了,如果我们在大模型回答时新建一个会话,上一个会话与服务器的连接就会被中断从而转为与新会话连接,所以上一个会话的回答就无法顺利生成。通义千问和讯飞星火都有针对这个问题做出处理,只要有回答正在生成就无法创建新会话,这样就可以避免这个现象的发生。
-
严重性: ⭐⭐
会导致大模型给出的回答无法顺利生成,对用户使用有一定的影响,也不符合正常的交互逻辑。
-
预期和改进建议:
目前大部分大模型产品对这个操作都有进行限制,比如回答生成时不允许提问、不允许新建对话等,保证回答能够顺利完成,但文心一言并没有对此进行处理,我本来以为这是一种特别的设计,但是切换后之前的回答并没有停止生成,而是无限的暂停,这显然就不是故意而为,而是一种BUG了。解决方案可以采用其他产品类似的做法,比如之前提到的回答生成时不允许提问、不允许新建对话,或是新建对话和进行新的提问则终止旧的回答。
1.2.3 BUG-3
1.2.3.1 可复现性及具体复现步骤
-
可复现性: 必然发生
-
复现步骤:
打开文心一言的百宝箱功能,在任意两个功能间快速切换时(在“精选”和“我的收藏”这两个版块间切换现象更为明显)。
1.2.3.2 具体情况描述
-
描述:
按照上述复现步骤进行操作后,比如快速从“我的收藏“切换至”精选“再切换至”我的收藏“,页面会连续闪烁显示两次”我的收藏“版块的内容,而不是期望的”精选“和”我的收藏“这两个版块各显示一次,或是直接不显示”精选“转而显示”我的收藏“。
-
展示:
1.2.3.3 BUG分析
-
成因:
这个BUG产生的原因可能是,百宝箱窗口里的各个导航并没有使用独立的路由,而是使用懒加载的方式,当点击某个导航时才即时从服务器拉取这个导航所属页面的信息,再将其显示在下面的内容区域中,当快速点击切换导航时,如果某个页面的内容较多,当这个页面的还没有全部拉取完成,内容还没有显示,此时再点击别的导航,拉取的内容就变化了,就会出现执行完这次拉取(这时拉取的已经是新页面的内容),显示已经显示在内容区了,然后再执行新的拉取请求,就会再将相同的内容重新显示一次,当两个页面的加载所需的时间相差较大时,这种现象就会变得比较明显。
-
严重性: ⭐
只是一种显示异常,但具体功能并没有受到影响,不影响用户的正常使用。
-
预期和改进建议:
当点击一个导航,如果这个导航还没有加载出来,此时在切换到另外一个导航,那么直接显示这个新的导航所指向的页面应该才是正常的交互逻辑,而不是在旧的页面和新的页面显示时都显示新的页面,导致新的页面显示两次。对此我的建议是可以将这四个页面分离,通过路由进行页面的切换,而不是直接共用同一个页面,这样容易导致显示内容的混乱,或是再拉取新内容的时候,取消旧请求的显示,这可能也是一种解决方案。
1.3 结论
项目 | 得分 |
---|---|
UI界面(20) | 17 |
交互体验(20) | 15 |
功能实用性(30) | 22 |
系统稳定性(30) | 20 |
总分(100) | 74 |
经过体验,文心一言给我的感受是一般,虽然对使用不是很有影响,但是还是存在比较多小BUG,在回答中也没有对关键词进行突出显示,并且在大模型能力和其他功能上也没有比其他产品脱颖而出的地方,百宝箱功能也没有名字看起来那么神奇,只是一些预设好的问题,然后大模型对这些问题进行回答,个人认为并没有很大的实用性,或许文心4.0的效果会更好,但是需要收费,就不进一步体验了。
2、通义千问
2.1 体验
2.1.1 介绍和使用
通义千问是由阿里巴巴集团旗下的阿里云开发的一款大型人工智能语言模型。通义千问具备强大的对话能力,能够与用户进行连续、深入的交流,理解上下文信息,并根据对话历史进行恰当的回应,提供流畅、自然的交互体验。通义千问的应用场景广泛,涵盖了日常效率提升、生活娱乐以及专业领域的需求,旨在通过先进的自然语言处理技术,为个人、企业和各行各业提供高效、创新的语言生成和理解服务。
-
主页,左侧是功能区,可以进行新建对话,切换对话等,下方是提问区域,输入内容即可提问,上方导航栏有百宝袋,提供了一些针对特定应用场景的回答
-
百宝袋界面
-
体验代码生成功能
-
体验问题解答功能
-
体验绘图功能
2.1.2 优缺点分析
-
优点:
- 界面基于设备UA标识符做了多端适配。
- 对回答中的重点信息或关键词进行了加粗突出显示。
- 用户对回答不满意可以重新生成,并且会记录每一次的回答(至多五次)。
- 回答结束后,会对用户接下来可能提出的问题进行推测,可以帮助用户更好的提问以及解决问题。
- 界面清爽,功能显示比较突出,用户不需要教程也可以快速上手使用。
- 可以上传图片和文档进行分析,并且文本、图片、文档单独分区。
- 可以根据名称对对话进行搜索,当会话数目较多时可以快速找到需要的会话。
-
缺点:
- 当页面缩放时,没有进行UI适配,会出现界面元素错位。
- 没有使用教程,对第一次使用且没有其他类似产品使用经验的用户不友好。
- 不能批量删除对话,需要逐一删除。
2.1.3 用户意见
- 画图同样有水印,画出的图不能直接使用。
- 希望可以加上一个使用文档,帮助用户更深入地了解和使用产品。
2.1.4 用户采访
- 背景: 福州大学软件工程专业的大三学生
- 需求: 可以根据文字描述生成相应的代码示例、可以对提出的编程领域的问题给出针对性的正确答案
- 使用的产品栏目: 办公助理、学习助手
- 问题和亮点: 界面比较干净,在代码编写上比文心一言更好一些,至少在显示上让人一目了然,不过文本配色不如文心一言,关键词和变量等不够突出,绘图功能同样也不咋地,并且绘图速度较慢
- 需要改进的地方: 改进一下代码的配色,增加关键词高亮等,让代码更好阅读,同时优化一下绘图质量和速度
2.2 BUG
2.2.1 可复现性及具体复现步骤
-
可复现性: 必然发生
-
复现步骤:
建立一个会话,并将会话名命名为hello等具有连续重复非中文字符的名称,然后对会话进行搜索,搜索时不将所有连续字符输入(比如输入hel),只输入其中的一部分。
2.2.2 具体情况描述
-
描述:
按照上述复现步骤进行操作后,可以发现会话存在,但是一旦输入这些连续非中文字符的部分,搜索结果就会为空,直到这些连续非中文字符全部输入,搜索结果就能正常显示。经测试,只要名称中有任意的连续相同的非中文字符,那么只要输入的是这串连续非中文字符的部分内容,就无法搜索到这个会话,除非将这些连续字符完全匹配。除此之外,搜索框还有字符长度限制,如果重复字符串较长,就可能会导致这个对话无法被成功搜索到。
-
展示:
2.2.3 BUG分析
-
成因:
这个BUG产生的原因可能是使用了正则表达式进行搜索匹配,而编写的正则模式未考虑到对连续重复字符的局部匹配情况,比如正则表达式可能过于严格,要求完全匹配完整的字符串,而不是允许部分匹配,所以导致了这个BUG的出现。
-
严重性: ⭐⭐⭐
会影响用户搜索对话功能的正常使用,若不修复用户对会话的命名会受到限制。
-
预期和改进建议:
这项功能正常的预期就是根据搜索内容匹配出正确的结果,改进建议就是对相关的模块进行检查,如果原因确实是正则表达式有误的话,对正则表达式进行修正和完善,并进行完整的测试即可。
2.3 结论
项目 | 得分 |
---|---|
UI界面(20) | 18 |
交互体验(20) | 16 |
功能实用性(30) | 24 |
系统稳定性(30) | 25 |
总分(100) | 83 |
经过体验,与文心一言相比,通义千问的界面给我一种清爽干净的感觉,让人更有使用的欲望,在回答中也对关键词句进行了加粗的突出显示,方便用户快速了解回答中的重点,美中不足的是,通义千问没有提供文档,这对那些没有使用过大模型的用户比较不友好,发现的BUG虽然比较少,但是也是存在的,不过总体而言,我对通义千问还是比较推荐的。
第二部分 分析
1、开发时间估计
团队背景: 人数6人左右,计算机大学毕业生,并有专业UI支持
产品名称 | 需求分析 | 架构设计 | 模型训练 | 前后端设计与开发 | 产品测试与部署 | 总开发时间(天) |
---|---|---|---|---|---|---|
文心一言 | 7 | 7 | ∞(资源、经费、技术有限) | 25 | 10 | 49 + ∞ |
通义千问 | 7 | 7 | ∞(资源、经费、技术有限) | 35 | 15 | 64 + ∞ |
2、同类产品对比排名
评分项目/产品名称 | ChatGPT | 文心一言 | 通义千问 | 讯飞星火 | Kimi |
---|---|---|---|---|---|
大模型性能(20) | 20 | 17 | 17 | 18 | 18 |
特色功能体验(20) | 19 | 16 | 16 | 19 | 19 |
UI效果(20) | 18 | 16 | 18 | 17 | 17 |
人机交互体验(20) | 18 | 15 | 16 | 17 | 17 |
稳定性(20) | 15 | 17 | 18 | 18 | 18 |
总分(100) | 90 | 81 | 85 | 89 | 89 |
根据以上评分得出排名如下(仅代表个人主观感受):
- ChatGPT
- Kimi / 讯飞星火
- 通义千问
- 文心一言
3、软件工程方面的建议
-
文心一言: 百宝箱功能似乎只是简单给出了一些预设的问题,并没有实际的作用,是不是可以考虑改进一下这个功能。
-
通义千问: 可以考虑给用户提供一份使用文档,这样可以帮助那些没有大模型使用经验的用户更快上手使用。
4、BUG存在的原因分析
-
文心一言:
-
具体的设计质量不高
比如上面提到的BUG-2,这显然就是一种设计失误,其他的类似产品(比如通义千问、讯飞星火、ChatGPT等)都对这个可能发生的情况进行了处理,说明这个问题是大模型在回答时都会出现的普遍问题,但是文心一言没有对它进行处理,这就是一种设计上的疏忽。此外,另外一个显示BUG也可能是设计上的问题导致的,因为不恰当的程序逻辑引发了内容重复显示的问题。 -
测试把关不严
我个人认为,从BUG-2中就可以看出,这个产品的测试人员把关不够严格,这本来是一个用户非常有可能进行的操作,但是测试人员并没有发现,当然还有一种可能,就是这个BUG就是文心一言的一种特性,但是它也带给了用户不好的体验,这样就是对用户的需求掌握的不够精确了。
-
-
通义千问:
-
开发人员粗心大意
上面提到的BUG,根据我的分析,可能是开发人员对搜索内容的正则表达式编写有误,导致搜索内容的字符串匹配失败,如果确实是这样,就说明开发人员考虑的不够周密,忽略了一些可能发生的特殊情况,并且这个功能也不太可能是因为技术问题无法实现,所以应该是因为开发人员粗心大意。 -
测试把关不严
从上面提到的BUG中,可以发现测试人员忽略了部分可能发生的边界情况,没有对产品进行比较完备的测试。
-
5、 软件团队问题
-
文心一言: 我觉得该团队的在产品测试方面还需要加强,有许多细节点没有被关注,产生这个问题的原因可能是开发时间比较紧张。
-
通义千问: 我觉得没有明显的问题。
第三部分 建议和规划
1、市场概况
1.1 市场规模
AI大模型的应用非常广泛,覆盖了大量的使用场景和应用领域,上可用于高新技术研究,下可用于日常问题解答。随着人工智能技术的不断进步和应用场景的日益丰富,AI大模型在全世界范围内得到了广泛的关注和应用。
统计数据显示,2023年我国AI大模型行业市场规模为147亿元,预计2024年将增长至216亿元。除此之外,AI大模型行业的发展得到了多方面的政策支持,从中央到地方,各级政府都积极出台相关政策以加速大模型产业的快速发展。国家数据局发布的《“数据要素x”三年行动计划(2024—2026年)(征求意见稿)》中明确提出了以科学数据支持大模型开发,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。
由此可见,AI大模型具有广阔的发展空间和发展前景。
1.2 直接用户与潜在用户数量
AI大模型目前的直接用户主要是科研机构,各大互联网企业以及一些已经将大模型应用于生产活动中的行业领域,比如计算机领域。
但是AI大模型的潜在用户数量非常庞大,因为大模型在自然语言处理、计算机视觉和语音识别等领域具有广泛的应用前景,可以应用于机器翻译、文本生成、问答系统、图像分类和生成等任务。这些任务在各行各业都有潜在的应用需求,包括互联网公司、金融机构、医疗健康、教育培训等领域。比如大学生就是一个规模非常庞大的潜在用户群体,以及之前提到的各个领域的从业人员,都可能成为大模型的潜在用户。
除此之外,随着AI大模型技术的进步和使用成本的降低,大模型的使用门槛也可能降低,更多的用户能够受益于大模型,其潜在用户的数量也将不断增加。
2、市场现状
2.1 已有产品
产品名称 | 开发组织 |
---|---|
ChatGPT | OpenAI |
文心一言 | 百度 |
通义千问 | 阿里 |
讯飞星火 | 科大讯飞 |
Kimi | 月之暗面 |
… | … |
2.2 上述产品的定位、优势与劣势
产品名称 | 定位 | 优势 | 劣势 |
---|---|---|---|
ChatGPT | 通用大模型 | 能够理解和处理各种复杂的语言结构和含义,能够结合上下文进行回答;能够处理多种语言;具备高度的泛化能力和鲁棒性;支持微调,可以根据特定场景进行优化以提高性能 | 对硬件要求较高,部署和运维成本高;国内使用受限,体验困难 |
文心一言 | 通用大模型 | 模型性能好,有丰富的应用场景和生态,AI产品矩阵比较全面;中文处理能力强 | 对硬件要求较高,部署和运维成本较高 |
通义千问 | 通用大模型 | 文档解读能力强;对用户语言理解好,回答较充分;有着强大的云计算基础设施,大模型定制化程度高,性能稳定;在智能客服、智能推荐等领域表现较好 | 图片解析能力一般;与外部生态的连接不够丰富,应用场景有限 |
讯飞星火 | 通用大模型 | 图片解析精准;产品生态强,有多个原生应用可接入;语音识别与生成技术领先,语音大模型应用广泛 | 语言大模型技术相对较弱,对文本长度和领域有一定的限制;使用成本高 |
Kimi | 通用大模型 | 大容量文本处理;能够处理多种语言;丰富的功能集成;安全性和隐私保护 | 在理解复杂或模糊查询方面可能存在局限 |
… | … | … | … |
2.3 上述产品间的关系与各方态势
-
关系:
上述产品间都属于同类型产品的竞争关系。
-
态势:
AI大模型行业的竞争格局激烈,众多企业纷纷投入研发,力求在这个新兴市场中占据一席之地。百度、阿里等科技巨头凭借其在人工智能领域的深厚积累和强大的技术实力,迅速占据了国内市场的主导地位。目前,大模型行业已经初步形成了多元化的竞争格局,每个大模型产品都拿出了自己的特色与亮点,比如讯飞星火的语音识别与生成技术、Kimi的大容量文本处理技术等等,这给用户提供了广泛的选择机会,用户可以根据自身需求,选择适合自己的大模型使用,所以各方态势并不是一成不变的,随着大模型的发展和应用场景的扩大,各个大模型的开发组织也要根据动态变化的产品需求对产品进行修改与优化,因此各方态势也在不断发生变化,但是各大科技巨头的产品还是占据了主要的市场。
2.4 领域阶段
AI大模型是当前人工智能领域的热点和前沿方向,目前正处于快速发展的风口阶段,当前的大模型在自然语言处理、计算机视觉等领域已经取得了显著的成果,在与这些领域相关的任务中,大模型表现出了强大的能力,它几乎可以应用在所有的行业之中,随着技术的进步和算法的优化,大模型的规模和性能将持续提升,帮助各个行业领域实现智能化升级。政府也对大模型技术的发展给予了鼓励与支持,在这样的环境下,AI大模型行业将迎来更加广阔的发展空间和发展机遇。
3、市场与产品生态
3.1 核心用户群与典型用户
- 核心用户群: 科研机构,各大互联网企业以及一些已经将大模型应用于生产工作中的行业领域。
- 典型用户:
- 科研人员:学历高,使用大模型进行数据分析与处理等。
- 开发者:学历较高,使用大模型协助开发,加快开发效率。
- 学生:还在教育阶段,使用大模型帮助学习,解答疑问。
- …
3.2 用户群体关系及构成用户生态的可能性
-
用户群体关系:
可以根据用户所使用或从事的主要应用领域对用户进行划分。
-
用户生态:
将用户按领域进行划分,就可以形成不同的用户领域社区,让属于该领域的用户加入社区进行交流与分享,形成按领域划分的社区用户生态。
3.3 相关产品关系及构成产品生态的可能性
-
相关产品关系:
大模型的子产品一般是基于大模型,针对某一特定功能或应用场景进行优化和拓展产生的,可以说是大模型针对特定任务的定制加强版,大模型具有全面的功能,但其子产品则在某一特别领域具有更强的能力。
-
产品生态:
可以将大模型运用到其他产品中,形成“大模型+”的产品生态,上述的许多产品已经具有这样的生态了。
4、产品规划
4.1 新功能设计与分析
-
新功能: 引入用户偏好,使用适当的算法,根据用户对历史回答的采纳情况,在之后的回答中优先为用户生成符合用户偏好的答案
-
NABCD模型分析:
-
N(需求):
在我们使用大模型时往往会遇到一个问题,好不容易在这个对话中“训练”好了一个回答基本比较符合自己需要的模型,但是一旦重新创建一个对话,大模型又会完全不了解你的偏好,你又得从头告诉大模型一些可以在每个对话中可以复用的信息,比如回答的格式要求、是否对回答进行正确性检验与判断等等,在每次的对话中都重述这些内容,对于那些使用大模型频率较高的用户显然体验是不太友好的。除此之外,如果没有对用户的偏好进行了解,要得到符合用户要求的答案往往需要进行多次生成,这样就需要耗费比较多的时间,使用效率也比较低,这对那些不太会描述问题的用户来说使用起来就比较困难。
-
A(做法):
当前的功能已经支持对回答进行“认可”和“不认可”的操作,我们可以设计合适的算法,根据用户对给出的回答进行的这些操作,也可以再添加一个采纳操作,根据用户对回答的采纳与否,推断出用户对回答的偏好,并将这些偏好以附加要求的形式隐式的添加在用户提出的问题中,帮助用户更快地找到希望得到的答案,用户也可以自行添加那些模板式的限制和要求以供算法使用。
-
B(好处):
通过引入这个功能,可以让生成的答案尽量靠近用户希望的结果,尽可能减少重新生成的次数,以此来提高用户的使用效率;这项功能还可以简化用户的使用流程,降低用户的使用门槛,让用户可以更加轻松地上手产品,给用户带来更好的使用体验。
-
C(竞争):
根据了解,当前其他同类型的产品并没有与这项功能类似的功能,因此我认为这项功能在市场上是比较有竞争力的。
-
D(推广):
可以基于现有的产品,通过产品版本更新迭代上线这项功能,也可以在产品更新上线时进行适当的宣传。
-
4.2 团队角色配置
角色 | 人数 |
---|---|
项目经理(自己) | 1 |
开发经理(可同时兼任其他角色) | 1 |
算法设计 | 2 |
前端开发 / UI设计 | 1 |
后端开发 / 数据库设计 / 算法实现 | 3 |
产品测试 | 1 |
4.3 详细规划
周数 | 工作内容 |
---|---|
1 | 需求分析与原型设计 |
2 - 3 | 系统架构与数据库设计,制定开发规范 |
4 - 10 | 具体功能开发与测试 |
11 | 进行产品的集成测试,并完成项目文档的撰写 |
12 - 13 | 修复测试过程中发现的BUG,对产品进行性能优化 |
14 - 15 | 产品发布用户体验测试,收集用户反馈,并针对用户反馈对产品进行优化改进 |
16 | 项目完整部署,正式上线 |