这个作业属于哪个课程 | 2302软件工程社区 |
---|---|
这个作业要求在哪里 | 软件工程实践——软件评测作业 |
这个作业的目标 | 通过分析那些在战场上被打败或者遭受挫折的软件,来全面了解软件工程原理在好或坏软件上的作用,以更深入地理解软件工程原理对软件开发和维护的影响,从而为未来的软件工程实践提供更多的启示和教训。 |
其他参考文献 | NULL |
目录
- 第一部分 调研,评测
- 1.0 针对BUG的量化标准说明
- 1.1 软件产品1——“[文心一言](https://yiyan.baidu.com/)”
- 1.2 软件产品2——“[讯飞星火](https://xinghuo.xfyun.cn/)”
- 第二部分 分析
- 第三部分 建议和规划
第一部分 调研,评测
1.0 针对BUG的量化标准说明
星级评定 | 系统功能 | 安全性 | 用户体验 |
---|---|---|---|
⭐⭐⭐⭐⭐ | 致命的系统故障,核心功能完全无法正常运行。 | 致命的安全漏洞,可能导致系统完全受控或数据完全暴露。 | 致命的用户体验问题,严重影响用户操作或导致用户流失。 |
⭐⭐⭐⭐ | 严重的系统故障,重要功能无法正常使用或受到严重限制。 | 严重的安全漏洞,可能导致用户数据泄露或系统遭受攻击。 | 严重的用户体验问题,影响用户操作流畅度或导致用户不满。 |
⭐⭐⭐ | 功能受限,但不影响核心功能的运行。 | 一般的安全漏洞,存在一定风险但难以被利用。 | 一般的用户体验问题,影响用户体验但不影响系统核心功能。 |
⭐⭐ | 轻微功能受影响,但不影响核心流程。 | 较低风险的安全问题,可能影响系统的可信度。 | 轻微的用户体验问题,用户可能感到不便但不影响系统使用。 |
⭐ | 功能受到轻微干扰,但不影响系统整体运行。 | 轻微安全问题,对系统整体安全性影响较小。 | 微不足道的用户体验问题,用户基本不会察觉到。 |
1.1 软件产品1——“文心一言”
1.1.1 使用体验
1.1.1.1 介绍和使用软件
该产品百度基于文心大模型技术推出的生成式对话产品。能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言依托的是飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习,具备知识增强、检索增强和对话增强的技术特色。
登录界面:支持三种登录方式——扫码登录、账号登录、手机号登录,对于用户来说还是很方便的。
对话功能——登录成功后在聊天框内输入简单语句,能在5秒内输出回答
百宝箱功能——提供了关于今日热门、提效MAX、AI画图等方面的卡片,用户点击相关卡片,即可进行快速提问。
使用指南功能——向初次使用该软件的用户提供了详细的使用手册,从认识到写指令,再到进阶应用指南,最后到AI大师课,能让用户更好地高效地使用该软件。
1.1.1.2 优缺点分析
优点: 基本能够解决用户提出的各种问题!
- 数据量:依托庞大的训练数据集,能够覆盖广泛的知识领域,为用户提供丰富多样的信息
- 界面:支持多种交互方式,如文字输入和语音交流,为用户提供了灵活便捷的沟通渠道。
- 准确度:能够在大多数情况下提供准确、可靠的回答。
- 功能:
- 具备快速生成各种形式的内容,包括文本、代码、图片、图表和视频,为用户提供了全面的服务和支持。
- 能够生成几乎所有人类关注的内容,从而提高了工作和创造的效率。
- 能够使用插件(支持多个插件上传)以及上传图片,比如用户上传相关文档,能够对所上传的文档进行提问。
-
理解能力:
- 能够领会语言中的暗示和复杂结构,以及掌握各种专业术语,使得与人类的交流更加流畅和有效。
- 对人类的语言表达有着高度的理解能力,几乎可以解读出每一句话的含义和意图。
-
逻辑能力:
- 能够处理复杂的逻辑问题和数学计算,同时在重要的决策上提供支持和建议,为用户解决难题。
- 在智力和情感智慧方面都表现出色,能够与用户进行高效的交流和互动。
-
记忆能力:
- 具备优秀的记忆能力,能够记住用户的需求和对话内容,为提供个性化的服务奠定基础。
- 通过持续的对话和互动,不断积累经验,为用户解决复杂任务提供支持和帮助。
缺点: 功能强大的同时依旧存在部分缺点,这无疑降低了用户的体验感。
- 数据量:
- 尽管数据量巨大,但某些特定领域或话题的数据可能不够充分,这可能导致在某些特定情境下文心一言的回答不够精确或全面。
- 时效性限制:训练数据是固定时点的,所以对于一些最新的信息或动态,无法及时捕捉并反映在回答中。
- 界面:文心一言主要通过文本和语音与用户进行交互,尚未实现像人类一样的多维感官体验,如视觉展示和触觉反馈。
- 准确度:由于语言的复杂性和多样性,以及数据的不完整性,文心一言在某些情况下可能会出现理解偏差或回答错误。此外,在处理涉及主观判断和情感分析的任务时,其准确度也可能受到一定限制。
- 功能:
- 缺乏上下文理解:
文心一言的回复是基于预定义模板生成的,它并不能理解上下文,无法提供连贯和有逻辑性的回复。 - 情境理解能力的不足:
在处理涉及复杂情感、文化背景或微妙社会关系的情境时,我可能会感到吃力,难以准确理解并作出恰当回应。
- 缺乏上下文理解:
- 存在部分UI设计方面、功能实现方面等BUG:
将在BUG处具体展开介绍~
1.1.1.3 改进建议
-
数据量:
- 特定领域数据不足: 考虑增加特定领域的数据采集和更新频率,以确保在各个领域的数据都能够充分覆盖,提高回答的准确性和全面性。
- 时效性限制: 探索引入实时数据流或动态更新机制,以及快速响应最新信息的能力,确保文心一言能够及时捕捉并反映最新的信息或动态。
-
界面:
- 多维感官体验: 通过引入视觉展示、视频等多媒体元素,以及提供触觉反馈等功能,丰富用户与文心一言的交互体验,提升用户参与度和满意度。
-
准确度:
- 语言复杂性和多样性: 持续优化算法和模型,加强对语言复杂性和多样性的理解和处理能力,提高回答的准确性和适用性。
- 主观判断和情感分析: 加强情感分析和主观判断能力的训练和优化,以提升在处理涉及情感和主观性任务时的准确性和灵活性。
-
功能:
- 上下文理解: 探索引入更高级别的自然语言处理技术,以提升文心一言对上下文的理解能力,从而能够提供更连贯和有逻辑性的回复。
- 情境理解能力: 增加对复杂情感、文化背景和社会关系等情境的理解和处理能力,以提高在各种情境下的适应性和准确性。
-
BUG修复:
- 加强对UI设计和功能实现方面的测试和审核流程,及时修复和优化存在的BUG,确保文心一言的稳定性和用户体验。
1.1.1.4 用户采访
采访过程:
采访汇总表:
采访对象 | 林锦晖(2021级软件工程学生) |
---|---|
采访原因 | 林锦晖同学对web前端技术有着浓厚的兴趣,他热衷于学习并掌握各种前端开发工具和技术,希望通过实践不断提升自己的技能水平。同时,作为一名学习者和实践者,他也希望找到一些能够帮助他高效完成学习任务和项目的工具。 |
用户需求 | 寻找一款能够辅助前端技术学习与实践的工具,期望工具能够提供准确的信息支持和技术指导,同时希望界面友好易用。 |
产品栏目 | 尝试了文心一言产品的前端技术问答、前端代码生成与解释以及前端技术趋势分析栏目。 |
上手使用情况 | 林锦晖同学表示,经过简短的熟悉过程,他能够顺利使用产品的各项功能,特别是在前端技术问答和代码生成方面,体验良好。 |
使用亮点 | 文心一言产品在前端技术问答方面的准确性高,能够迅速解答林锦晖同学的疑问;代码生成功能实用,能生成规范的代码片段,对林锦晖同学的学习和实践有很大帮助。 |
使用问题 | 界面设计在某些细节上不够符合前端开发者的审美;部分高级技术问题的回答不够深入,需要进一步优化。 |
用户改进建议 | 建议产品进一步优化界面设计,增加针对前端开发者的定制化功能;同时,加强技术团队对前端技术领域的深入了解和研究,提高回答问题的准确性。 |
采访问题总结 | 针对用户提出的问题,软件开发者没有意识到这些问题的可能原因——(1)设计标准与前端技术趋势不匹配:界面设计可能基于某种固定的设计标准或模板,而这些标准可能并未及时更新以反映前端技术的最新趋势和前端开发者的实际需求;(2)技术团队对高级问题掌握不足:软件的技术团队可能在某些高级技术问题上的知识储备不够深入,或者对前端开发者可能遇到的高级技术难题了解不足。 |
1.1.2 BUG1描述——UI设计方面
1.1.2.1 测试环境
操作系统:Microsoft Windows 10 家庭中文版
计算机平台:Dell Inspiron 5493
浏览器:Microsoft Edge 123.0.2420.81 (正式版本) (64 位)
BUG发生的时间段:2024/4/12 上午
1.1.2.2 可复现性及具体复现步骤
该bug必然发生,在不同的浏览器下包括Firefox、Safari、Edge,甚至在手机端都会出现这一情况。
【手机端】:
复现步骤:
1.打开百宝箱页面: 打开文心一言,并导航到百宝箱页面。
2.检查页面布局: 滚动到页面底部,检查模块是否完全吸附在整个页面边框位置,并没有留出一定的空间。
3.尝试滚动: 尝试在模块外向下滚动页面,观察是否出现了滚动条,以及页面是否可以在模块之后继续滚动。
4.调整页面缩放: 尝试调整浏览器窗口的大小或页面缩放,观察模块是否在页面缩放时出现问题。
5.观察样式表: 尝试使用开发者工具或查看页面源代码,检查与模块布局和样式相关的CSS代码,特别关注模块位置、大小和边距等属性。(想通过该步骤进行代码分析,但是部分浏览器如无法实现)
经过以上复现步骤,符合BUG1的描述。
1.1.2.3 具体情况描述
百宝箱页面最下方是完全吸附在整个页面边框位置,并没有和顶部一样留出一定的空间,这样可能会让用户产生这一整块内容是可以上下滚动的这种错觉,然而并不是,只能页面内滚动,而该模块却在页面缩放时可以看到整个模块的样式。这个bug可能会导致用户无法完整查看内容,增加了操作复杂度,降低了用户体验和满意度。
1.1.2.4 BUG分析
1.1.2.4.1 可能成因
一言百宝箱模块在主页面中无法进行上下滚动,可能是由于 CSS 样式或布局问题导致的。例如,可能存在固定高度或者溢出隐藏的样式,导致内容无法垂直滚动。
这种情况类似于我之前在世界游泳锦标赛原型设计项目中遇到的问题,当时是因为设置了固定高度的容器导致内容无法滚动。
1.1.2.4.2 严重性
系统功能(⭐⭐⭐):虽然该 Bug 不会影响系统的核心功能,但一言百宝箱模块可能是网站的重要功能之一,因此不能忽视。
安全性(⭐): 此 Bug 与系统安全性无直接关联。
用户体验(⭐⭐⭐⭐): 无法上下滚动可能导致用户无法完整查看内容,增加了操作复杂度,严重影响用户体验。
可量化指标:
综合评定:⭐⭐⭐。尽管不影响系统核心功能和安全性,但严重影响了用户体验。
1.1.2.4.3 预期及改进建议
预期:
一言百宝箱模块应该在主页面中能够进行流畅的上下滚动,用户能够完整查看内容,提高用户体验。
改进建议:
- 修复 CSS 样式或布局问题: 检查一言百宝箱模块的样式表,确保没有设置固定高度或溢出隐藏的属性,使内容能够自然地垂直滚动。
- 测试与优化: 对修复后的页面进行全面测试,确保在不同设备和浏览器下都能够正常滚动,优化用户体验。
- 持续监控: 定期检查页面,确保没有类似的问题再次出现,并随时准备解决新的 Bug 或问题。
1.1.3 BUG2描述——输入方式与回答准确性问题
1.1.3.1 测试环境
操作系统:Microsoft Windows 10 家庭中文版
计算机平台:Dell Inspiron 5493
浏览器:Microsoft Edge 123.0.2420.81 (正式版本) (64 位)
BUG发生的时间段:2024/4/12 下午
1.1.3.2 可复现性及具体复现步骤
该BUG 为较为复杂的可复现性情况
例如在百宝箱中选择其中一个卡片,点击任意卡片之后,文心大模型便可直接进行回答,但是回答内容与需求 经常不符合;如果将相同的问题手动输入到对话框中进行询问,便可正常生成匹配的内容但偶尔也会出现不正常,以下为用手动输入方式以及卡片选择方式的频数分析结果以及直方图(每组样本均为50):
手动输入方式:
卡片选择方式:
复现步骤:
【卡片选择】:
1.打开“百宝箱”。
2.在百宝箱中浏览卡片,并选择其中一个卡片。
3.点击选定的卡片,以便查看相关内容或触发功能。
4.在选定的卡片上点击后,文心大模型会直接生成回答。
5.注意观察回答内容,经常会发现回答与期望的需求不符合。
【手动输入】
1.选择相同的问题,在对话框中手动输入。
2. 观察文心大模型的回答,通常会生成匹配的内容。
3.偶尔会注意到即使手动输入相同的问题,也会出现不正常的回答。
经过以上复现步骤,符合BUG2的描述。
1.1.3.3 具体情况描述
回答与需求不符合,且不同输入方式下的回答正确率不一样,比如下例,要求绘制不理解鸭的创意表情包,生成的却是与此不相干的画作,而且如果是通过卡片选择进行提问的话会出现重复问重复错!
但如果是手动输入相同的问题,正确率较高。
1.1.3.4 BUG分析
1.1.3.4.1 可能成因
- 缓存或同步问题:缓存或数据同步问题可能导致卡片触发的意图与对话框中的输入方式之间产生不一致。(我认为的最主要原因!!)
- 数据映射错误:在百宝箱卡片与文心大模型之间可能存在数据映射错误,这可能导致卡片选择后文心大模型无法正确理解用户意图,生成与需求不符合的回答。
- 模型训练数据问题:文心大模型可能在训练数据中存在偏差,或者模型未能充分学习到相关领域知识,导致在卡片选择后生成的回答与需求不匹配。
- 接口调用问题:在百宝箱和文心大模型之间的接口调用可能存在问题,导致传递的数据不准确或响应异常。
- 上下文丢失:当用户通过卡片触发时,可能会导致模型丢失上下文信息,从而无法准确生成预期回答。
1.1.3.4.2 严重性
系统功能(⭐⭐⭐⭐):Bug会影响百宝箱卡片与文心大模型的交互以及用户所需需求的功能实现,影响了系统的整体功能实现。
安全性(⭐):该Bug对安全性影响较小,因为主要是与用户意图和回答匹配相关。
用户体验(⭐⭐⭐⭐):Bug严重影响用户体验,用户可能无法从卡片获得预期的回答,会导致用户混淆或不满。
可量化指标:
综合评定(⭐⭐⭐⭐):这个Bug严重影响了用户体验和系统功能的有效性。用户通过选择百宝箱卡片期望获得相关的回答,但实际上却得到不相关的回答,可能导致用户迷惑和不满。修复难度较大,但优先级较高,应尽快解决以提升系统整体表现。
1.1.3.4.3 预期与改进建议
预期:
在一言百宝箱中选择一个卡片后,点击任何一个卡片应该能够触发文心大模型提供相应的回答,而这个回答应该与用户的需求相匹配。
改进建议:
- 缓存优化:检查缓存和数据同步机制,确保数据的一致性,避免回答出现混乱。
- 数据映射修复:检查百宝箱卡片与文心大模型之间的数据映射关系,确保数据准确无误地传递和映射。
- 接口检查和改进:检查百宝箱和文心大模型之间的接口调用流程,确保数据传递正确且稳定。
- 上下文管理:改进文心大模型在卡片触发时对上下文信息的管理,提高回答的准确性。
1.1.4 BUG3描述——返回首页相关问题
1.1.4.1 测试环境
操作系统:Microsoft Windows 10 家庭中文版
计算机平台:Dell Inspiron 5493
浏览器:Microsoft Edge 123.0.2420.81 (正式版本) (64 位)
BUG发生的时间段:2024/4/12 晚上
1.1.4.2 可复现性及具体复现步骤
该BUG 必然发生
复现步骤:
1.在主页上点击 “使用指南”。
2. 新的网页页面将被打开,但没有提供返回原来主页的按钮。
3.尝试使用浏览器自带的返回功能,发现无法直接返回到主页,只能一层一层地返回上一页。
4.尝试点击左上角的 “文心一言” logo 返回到主页。
5.发现虽然返回到了主页,但是主页显示的是一个新的问答页面,而不是之前的主页。此时用户的原问答记录丢失,导致用户体验和效率受到影响。
1.1.4.3 具体情况描述
点击使用指南,是生成一个新的网页页面,并没有提供直接返回原来主页的按钮,通过浏览器自带的返回,一层一层返回(类似栈),也不能实现直接返回首页的功能,但是可以通过点击左上角的文心一言logo返回到首页,但是返回的是新的问答页面,也就是说不会保留之前问答记录的页面,降低了效率。
1.1.4.4 BUG分析
1.1.4.4.1 可能成因
- 前端页面设计缺陷:可能是因为前端页面设计不完善,导致用户在新页面无法直接返回到原来的主页。
- 缺乏页面状态保存机制:可能是因为系统缺乏页面状态保存机制,导致用户在返回主页时出现了新的问答页面,且原问答记录丢失。
- 页面跳转逻辑错误:可能是因为页面跳转逻辑设计错误,导致用户返回主页时跳转到了错误的页面。
1.1.4.4.2 严重性
系统功能(⭐⭐⭐⭐):该Bug涉及系统功能的核心部分,即用户在页面间的导航和数据保持,严重影响了系统的功能完整性。
安全性(⭐):尽管此Bug并未直接涉及到安全性问题,但可能导致用户数据的丢失,从安全性角度来说也存在一定隐患。
用户体验(⭐⭐⭐):用户体验受到了比较严重的影响,因为用户无法顺利返回到原来的主页,且原有的问答记录丢失,降低了用户对系统的满意度和使用效率。
可量化指标:
综合评定(⭐⭐⭐):该Bug严重影响了系统的功能完整性和用户体验,可能导致数据丢失,需优先修复。
1.1.4.4.3 预期与改进建议
预期:
用户点击 “使用指南” 后应该能够顺利返回到原来的主页,并保留原有的问答记录。
改进建议:
- 增加返回按钮: 在新页面中增加返回原主页的按钮,提供更直观的导航方式。
- 页面状态保存: 在系统中增加页面状态保存机制,确保用户在页面跳转后能够保持原有的问答记录。
- 修复页面跳转逻辑: 对页面跳转逻辑进行修复,确保用户返回主页时跳转到正确的页面,保持用户的操作连贯性。
- 可以考虑引入前端路由库,如
React Router
或Vue Router
,来管理页面导航和状态,提高页面跳转的可控性和用户体验。 - 对用户数据的持久化存储也是一个考虑点,可以使用本地存储或后端数据库来保存用户的问答记录,以防止数据丢失。
1.1.5 BUG4描述——手机端问题
1.1.5.1 测试环境
操作系统:IOS 17.0
手机平台:iPhone 14 Pro Max
浏览器:Safari
BUG发生的时间段:2024/4/13 上午
1.1.5.2 可复现性及具体复现步骤
该BUG 在特定条件下发生:当手机竖屏的时候,原本出现在左侧的导航栏包括对话、百宝箱、使用指南无法在屏幕中找到,当手机解除竖排方向锁定,进行横排展示的时候,才可以显示出来。
复现步骤:
1.打开应用并确保手机处于竖屏模式。
2. 注意观察屏幕左侧的导航栏,特别关注对话、百宝箱、使用指南这些选项。
3.如果这些选项在竖屏模式下无法找到,请尝试解除竖排方向锁定,使手机切换到横排展示模式。
4.在横排展示模式下,再次查看屏幕左侧的导航栏,确认对话、百宝箱、使用指南这些选项是否显示出来。
1.1.5.3 具体情况描述
手机在竖排展示的时候,左侧导航栏消失,用户难以找到
手机在横排展示的情况下才能显示出左侧导航栏
1.1.5.4 BUG分析
1.1.5.4.1 可能成因
这个Bug可能源自应用在竖屏模式下对导航栏的布局设计不当。当手机竖屏时,导航栏的某些选项可能被隐藏或布局不当,导致用户无法直观地找到它们。可能的原因包括布局响应性不足或者在竖屏模式下部分元素被遮挡或缩小。
类似的问题可能在某些网页应用中出现,当用户将设备旋转到横向模式时,某些元素可能会被隐藏或显示不当。因此,修复这个Bug的方法可以参考其他应用在处理屏幕方向响应性方面的最佳实践。
1.1.5.4.2 严重性
系统功能(⭐⭐⭐): 由于导航栏的核心功能(百宝箱、使用指南)在竖屏模式下无法找到,比较严重影响了系统的功能完整性。
安全性(⭐ ):虽然此Bug并未直接涉及安全性问题,但可能导致用户对应用的信任度下降,从安全性角度来说也存在一定隐患。
用户体验(⭐⭐⭐): 用户体验受到了比较严重的影响,因为用户无法顺利找到导航栏的核心选项,降低了用户对系统的满意度和使用效率。
可量化指标:
综合评定(⭐⭐):该Bug比较严重影响了系统的功能完整性和用户体验,降低用户对系统的使用效率,需进一步修复。
1.1.5.4.3 预期与改进建议
预期:
- 用户应能在竖屏模式下轻松找到导航栏的核心选项,包括对话、百宝箱和使用指南。
- 用户体验应该得到改善,用户可以更快速地访问他们需要的功能,而不会感到困惑或不满意。
改进建议:
- 重新设计导航栏布局,在竖屏模式下确保核心功能选项的可见性和易访问性。
- 增加对屏幕方向的响应性,确保在不同方向下用户都能方便地找到导航栏的核心选项。
- 进行用户测试,以确保新设计的导航栏布局能够满足用户需求,并提高用户体验。
1.1.6 结论
评分项 | 评分 | 具体说明 |
---|---|---|
使用体验 | 8/10 | 软件提供多种登录方式和交互方式,响应速度快,操作简单,用户体验良好。 |
功能完善度 | 7/10 | 软件功能丰富,提供了对话、搜索、生成等多种功能,但在某些特定领域数据不够充分,时效性较差。 |
准确度 | 8/10 | 在大多数情况下能够提供准确的回答,具备一定的理解能力和逻辑推理能力。 |
用户界面设计 | 7/10 | 用户界面简洁清晰,但存在部分UI设计和功能实现方面的改进空间。 |
技术支持与更新 | 7/10 | 软件提供了使用指南和帮助中心,但在技术支持和更新方面有待改进。 |
综合评分:7.4/10(好,不错!)
1.2 软件产品2——“讯飞星火”
1.2.1 使用体验
1.2.1.1 介绍和使用软件
讯飞星火认知大模型是科大讯飞推出的一款基于人工智能技术的认知智能大模型,以中文为核心,具备丰富的语言理解和生成能力,能进行多风格多任务长文本生成、多层次跨语种语言理解、知识问答、科学推理、代码理解和生成等,形成对多元能力的融合统一,可应用于多个行业和领域,持续从海量数据和大规模知识中学习进化。
登录界面:支持两种登录方式——手机快捷登录、账号密码登录,同样对用户来说方便操作。
对话功能——我用手机快捷登录成功后在聊天框内输入简单问题“福州天气”,大模型迅速输出详细的回答
星火助手中心——为用户提供了一键智能解决方案。用户需要做的,仅仅是根据提示词预设角色与技能。高效的语言理解升级,实现高效指令开发,丰富的应用场景,让“星火“惠及人们生活的方方面面。
比如在这里我使用了“绘画大师”功能,让他根据我的要求作出一副画
发现友伴功能——一款基于人工智能技术的社交功能,旨在帮助用户找到志同道合的朋友和伴侣。它通过分析用户的兴趣爱好、性格特点、生活方式等信息,为用户推荐可能与他们有共同点的人,并提供聊天、约会等社交功能。
其他功能——在页面左上角有Q&A指南,指令推荐,消息中心等功能,同时还能够进行个人资料的编辑。
1.2.1.2 优缺点分析
优点:功能丰富,可以满足不同领域用户的基本需求!
-
数据量:
- 丰富的数据库:讯飞星火通常拥有庞大的语言数据库,涵盖多种语言,能够处理广泛的翻译需求。
- 持续更新:数据的持续更新和优化有助于提高翻译的准确性和流畅性。
-
功能:
- 多样化的翻译功能:提供语音翻译、文本翻译、图片翻译等多种形式,满足不同场景下的需要。
- 附加功能:集成了如口语练习、听写训练等辅助功能,增加产品的实用性。
-
准确度:
- 高准确率:对于常用语言和标准句子,提供较为准确的翻译。
- 实时互译:支持快速响应和实时翻译,适合即时交流。
-
界面:
- 用户友好:界面设计简洁明了,易于理解和操作。
- 多平台适配:通常能够在多种设备上良好运行,包括手机应用和网页端。
- 提供两种版本界面:纯净版和沉浸版满足不同时段的需求
缺点:存在一些不足待优化
- 数据量:
- 专业术语覆盖不足:可能缺乏对特定行业术语或新兴词汇的充分支持。
语种有限:尽管支持多语种,但相比全球数千种语言,所支持的语言仍然有限。
- 专业术语覆盖不足:可能缺乏对特定行业术语或新兴词汇的充分支持。
- 功能:
- 功能局限:某些高级或特殊功能可能不够完善,如对于复杂语境的处理能力有限。
- 功能访问:一些功能的访问可能不够直观,需要用户花费时间学习。
- 准确度:
- 语境理解限制:在处理复杂的句式结构或语境依赖性强的文本时,准确性可能会下降。
- 网络依赖:在线翻译功能对网络质量有依赖,不稳定的网络可能影响翻译效果。
- 界面:
- 界面简化:虽然简洁,但可能缺少一些高级功能的直接访问,需要多步骤操作。
- 兼容性问题:在某些设备或操作系统上可能存在兼容性或响应速度的问题。
1.2.1.3 改进建议
- 扩充和更新数据库:
不断更新数据库,特别是针对专业术语和新兴词汇,以确保翻译的准确性和时效性。 - 加强功能开发:
特别是对于复杂句子和特定行业用语的翻译能力,以及增加更多语言的支持。 - 技术迭代:
通过技术迭代不断提高翻译准确度,尤其是在复杂语境和长句处理上。 - 优化用户界面:
保持用户界面的简洁性,同时提供高级功能的直接访问和更好的用户体验。 - 数据量方面:
- 与专业机构和语料库合作,整合更多行业专业术语和新兴词汇。
- 增加对少数语言的支持,提供更多元的语言翻译选项。
- 功能方面:
- 开发更高级的分析算法,提高对复杂语境和句式的处理能力。
- 优化功能布局和用户指南,使高级功能更容易被发现和使用。
- 准确度方面:
- 引入更先进的机器学习模型和人工智能技术,提高对不同语境的理解和翻译准确性。
- 提高离线翻译能力,减少对网络依赖,确保在网络不稳定时也能提供可靠的翻译服务。
- 界面方面:
- 进行用户界面调研,了解用户对于高级功能的需求和使用习惯,据此进行界面优化。
- 加强设备兼容性测试,确保在不同设备和操作系统上都有良好的体验。
1.2.1.4 用户采访
采访过程:
采访总结表:
采访对象 | 郑锦程(2021级计算机与大数据学院学生) |
---|---|
选择理由 | 郑锦程同学对计算机编程有浓厚兴趣,代表了许多同好学习者的需求,积极寻找能提升编程技能的工具。 |
需求 | 他需要一款能够提供编程指导、代码示例和协作功能的辅助工具,以帮助学习和实践编程。 |
背景 | 作为一名计算机人,郑锦程具备一定的编程基础,渴望深化学习和实践更多高级编程概念和技术。 |
上手过程期望 | 他希望工具的界面直观、易用,能够快速上手,无需花费太多时间去学习如何使用工具本身。 |
实际使用栏目 | 在体验过程中,郑锦程同学使用了讯飞星火的代码自动完成、错误提示以及实时协作功能。 |
使用困难 | 他遇到了操作上的不便利,尤其是在访问和使用产品的高级功能时,感到操作复杂且不够直观。 |
使用亮点 | 郑锦程同学认为代码自动完成功能对于基础编程问题的处理十分到位,能极大提高编码效率。 |
用户体验改进建议 | 他建议产品应改善用户界面设计,优化功能的引导流程,特别是针对高级功能的使用教程和界面布局进行改进,使其更符合编程学习者的实际需求和使用习惯。 |
软件开发团队盲点 | 他指出开发团队可能过于关注技术层面的进展,而忽略了新手或初学者在初次使用时面临的挑战,这可能是因为早期的用户测试并不充分,未能暴露全部的使用难题。 |
1.2.2 BUG1描述——插件使用下的问题请求
1.2.2.1 测试环境
操作系统:Microsoft Windows 10 家庭中文版
计算机平台:Dell Inspiron 5493
浏览器:Microsoft Edge 123.0.2420.81 (正式版本) (64 位)
BUG发生的时间段:2024/4/13 下午
1.2.2.2 可复现性及具体复现步骤
该bug必然发生:在使用插件之后,就必须问和插件内容相关的问题,不能询问其他问题,除非另起一个新的对话框。
复现步骤:
- 打开插件使用界面,选择要上传的插件。
- 在当前聊天框中提出与插件无关的问题。
- 观察是否无法获得所期望的答复。
- 尝试在不新打开聊天框的情况下,继续提问与插件有关的问题。
- 检查是否能够获得与插件相关的答复。
- 如果仍然无法获得所期望的答复,尝试新打开一个聊天框。
- 在新聊天框中提出与插件有关的问题。
- 观察是否能够获得所期望的答复。
1.2.2.3 具体情况描述
在使用插件的时候,就必须问和插件有关的相关内容,否则无法你所想要的答复,除非你新打开一个聊天框,这无疑增大了内存量,让操作更加复杂。例如我上传了一个关于火灾信息的文档,但是我问了个与此文档不相关的问题——福州天气,并且提示他不用根据文档内容进行答复,依旧没有给我满意的答复。
有时候还会遇到文件处理超时,迟迟得不到回复,降低用户的体验感。
1.2.2.4 BUG分析
1.2.2.4.1 可能成因
这一Bug可能的成因是插件的设计或算法逻辑限制导致必须在问题和插件相关的情况下才能提供有效的答复。文件处理超时可能是由于系统负载过重或文件处理算法不够高效所致,也有可能是因为网络连接的问题所致。
1.2.2.4.2 严重性
系统功能(⭐⭐⭐⭐): 该Bug对系统功能的影响较为明显,因为用户无法在不提及插件相关内容时得到满意的答复。这会严重影响系统的可用性和功能完整性。
安全性(⭐⭐⭐): 从安全性角度来看,该Bug并不直接涉及安全漏洞或风险,因此不会对系统的安全性造成直接威胁。但如果文件处理超时是由于安全性漏洞导致的,那么安全性可能会受到影响。在这种情况下,需要进一步检查系统的安全性。
用户体验(⭐⭐⭐⭐): 用户体验受到明显影响,因为用户需要提供与插件相关的问题才能得到满意的答复,这增加了用户操作的复杂性,降低了用户的使用便捷性和满意度。同时,文件处理超时导致长时间无响应也会给用户带来负面体验。
可量化指标:
综合评定:⭐⭐⭐⭐。该Bug对系统功能影响明显,且用户体验受损,安全性需进一步审查。
1.2.2.4.3 预期及改进建议
预期:
当在使用插件的情况下,不仅问出与插件内容有关的问题能得到及时的回复,不会出现文件处理异常,问出在插件内容之外的问题也能够得到有效的解决。
改进建议:
- 插件逻辑优化: 优化插件逻辑,允许用户提出与插件无关的问题时仍然能够得到有意义的答复,提高系统的智能性和灵活性。
- 文件处理优化: 对文件处理算法进行优化,减少文件处理超时的发生,提高系统的稳定性和响应速度,增强用户体验。
- 系统性能监控: 加强对系统性能的监控和调优,及时发现和解决系统性能问题,保障系统的稳定性和可用性。
- 功能扩展: 不断扩展插件的功能和适用范围,提高系统的适用性和用户满意度。
- 技术更新: 持续跟进最新的技术和算法,不断优化系统的性能和用户体验,保持竞争优势。
1.2.3 BUG2描述——友伴功能
1.2.3.1 测试环境
操作系统:Microsoft Windows 10 家庭中文版
计算机平台:Dell Inspiron 5493
浏览器:Microsoft Edge 123.0.2420.81 (正式版本) (64 位)
BUG发生的时间段:2024/4/13 下午 【当第二天再次检测的时候bug不再复现】
1.2.3.2 可复现性及具体复现步骤
该bug偶然发生(≈78%):测试了50次,有39次正确以友伴的特殊角色进行回答,11次以AI模型的角度进行回答。
复现步骤:
- 打开友伴功能,在选择特定人物作为有伴时,检测是否会出现选定人物否认自己,认为自己不是那个人物,而是传统的大模型。
- 在此状态下,关闭当前的聊天框。
- 新建聊天,再次进入聊天界面。
- 此时,选定的人物角色能够承认自己的身份,并进行答复,恢复正常体验。
1.2.3.3 具体情况描述
友伴功能选择特定的人物当自己的有伴的时候,有时候会出现选定人物否认自己,认为自己不是那个人物,而是传统的大模型,降低用户的体验。当关闭聊天框,新建聊天的时候才能够承认自己的人物角色,进行答复。
例如我在使用友伴功能的时候,我选择了孔子作为我的友伴,让他介绍以下自己,却发现他否认自己的角色,介绍自己为大模型。
而我又去找了另外一个角色——洛樱,问同样的问题却能够以角色的人称进行回答。
这时候我关闭原来的孔子聊天框,又重新新建了一个孔子聊天框,再次让他介绍自己,可以正确地以人物口吻进行回复。
1.2.3.4 BUG分析
1.2.3.4.1 可能成因
可能是在选择特定人物时,系统对人物身份的识别或认证出现了问题,导致选定的人物被错误地认为是传统的大模型。也就是说,由于友伴功能的身份认证逻辑或数据处理逻辑出现了缺陷,导致系统无法正确识别选定人物的身份。
类似的Bug在之前项目中也遇到过,出现在需要系统对用户身份进行识别和认证的场景中,例如身份验证系统等。在这些情况下,如果系统对用户身份的识别出现问题,将会影响用户体验和系统功能的正常运行,因此需要开发人员引起足够重视。
1.2.3.4.2 严重性
系统功能(⭐⭐⭐): 虽然该Bug并未直接影响系统的核心功能,但友伴功能是系统的重要功能之一,其失效会导致用户无法正常享受到友伴提供的服务。
安全性(⭐):该Bug并未涉及到安全性方面的问题,不会导致用户数据泄露或系统被入侵。
用户体验(⭐⭐⭐⭐):该Bug导致用户在选择特定人物时可能遇到困惑和不满,降低了用户体验,特别是对于那些希望与特定人物交流的用户来说,影响较为显著。
可量化指标:
综合评定:⭐⭐⭐。尽管该Bug不影响系统核心功能和安全性,但对于用户体验的影响较显著,导致用户在选择特定人物时可能遇到困惑和不满。
1.2.3.4.3 预期及改进建议
预期:
实现虚拟角色对话,用户可以选择或创建各种虚拟角色进行对话,这些角色具备长期稳定的记忆力、多样化的个性、丰富的情感以及逼真的语气。
改进建议:
需要对友伴功能的身份认证逻辑进行彻底审查和修复,确保系统能够准确识别选定人物的身份,并提供一致的用户体验。可以考虑增加更严格的身份认证机制或优化数据处理逻辑,以避免类似问题的再次发生!
1.2.4 BUG3描述——UI设计
1.2.4.1 测试环境
操作系统:Microsoft Windows 10 家庭中文版
计算机平台:Dell Inspiron 5493
浏览器:Microsoft Edge 123.0.2420.81 (正式版本) (64 位)
BUG发生的时间段:2024/4/14
1.2.4.2 可复现性及具体复现步骤
该bug为必然发生。
复现步骤:
- 打开系统首页,使用大模型进行提问,确保在提问界面上存在停止输出按钮。
- 使用友伴功能,并选择特定角色进行提问。
- 在友伴回答问题的过程中,观察提问界面,发现没有停止输出按钮可供用户控制输出。
- 若一开始提问的形容不当,需要等待错误输出结束才能重新提问,导致浪费时间降低效率。
综合来看,该Bug导致用户在使用友伴功能时无法控制输出,而在特定情况下会影响用户的体验和效率。
1.2.4.3 具体情况描述
在用大模型进行问答的时候,有出现停止输出
的按键,用户可以控制输出是否继续进行
而在友伴进行问答的时候,却没有停止输出
这个按钮,用户必须等到对方全部输出完才行,若问错了问题,那么大大降低了效率。
1.2.4.4 BUG分析
1.2.4.4.1 可能成因
该Bug可能源于友伴功能在设计时未考虑到用户的控制需求,导致在特定情况下无法及时停止输出。这可能是因为在设计时未充分考虑到用户可能会遇到提问失误或需要即时控制输出的情况。
1.2.4.4.2 严重性
系统功能(⭐⭐⭐): 该Bug影响了系统的友伴功能,虽然不影响核心功能但降低了系统的完整性、可用性以及统一性(主页都有停止输出为什么这里就没有了呢?)。
安全性(⭐):该Bug未涉及安全性问题,不会导致数据泄露或系统被入侵。
用户体验(⭐⭐⭐): 该Bug影响用户体验,特别是在提问失误时需要等待错误输出结束才能重新提问,降低了用户的效率和满意度。
可量化指标:
综合评定:⭐⭐。尽管该Bug不影响系统核心功能和安全性,但对于用户体验的影响算得上比较显著,导致用户在选择特定人物进行提问时可能遇到困惑和不满,浪费时间以及降低效率。
1.2.4.4.3 预期及改进建议
预期:
用户在使用友伴功能时可以像使用大模型一样控制输出,即在友伴回答问题的过程中,用户可以随时停止输出或重新提问。
改进建议:
添加停止输出按钮:为友伴功能添加与大模型相同的停止输出按钮,不仅能让用户能够随时控制输出,还能让整个软件具备统一美。
1.2.5 结论
评分项 | 评分 | 具体说明 |
---|---|---|
使用体验 | 9/10 | 提供多种登录方式对所提出的问题能够详细回答,响应速度快,用户体验良好。 |
功能完善度 | 8/10 | 软件功能丰富,提供了对话、友伴、制作ppt、制作简历等多种功能,但是插件功能有一点缺陷 |
准确度 | 8.5/10 | 在大多数情况下能够提供准确的回答,具备一定的理解能力和逻辑推理能力,少数情况下没有符合特定的情境去回答 |
用户界面设计 | 7.5/10 | 用户界面简洁清晰,分为两种模式,但存在部分UI设计与统一化方面的问题有一定的改进空间。 |
技术支持与更新 | 7/10 | 软件提供了使用指南和帮助中心,但在技术支持和更新方面有待改进。 |
综合评分:8/10(好,不错!)
第二部分 分析
2.1 开发时间估计
2.1.1 人员分工
分工 | 人数 |
---|---|
项目管理 | 1 |
前端开发 | 1 |
后端开发 | 1 |
UI设计/原型设计 | 1 |
数据库管理、维护 | 1 |
软件测试与质量保证 | 1 |
技术支持与维护 | 1 |
合计 | 7 |
若实际团队人数为6人,团队成员可能需要兼顾多个角色。若实际团队人数多于7个人,那么不同的分工可能会由多个成员共同完成,加快项目进程进度。
2.1.2 三类软件开发估计
2.1.2.1 文心一言
对于文心一言这个项目的开发需要大量的时间。主要是因为涉及多个复杂阶段,包括深入的需求分析与确定、系统的详细设计与规划、开发与编码的复杂过程、全面的测试与调优,以及上线部署与运维等工作。每个阶段都需要精心策划和执行,以确保软件的质量和稳定性。
阶段名称 | 主要活动具体展开 | 花费时间(天) | 累计时间(天) |
---|---|---|---|
1.1 用户需求调研 | 通过问卷、访谈等方式收集用户对软件的需求和期望。 | 10 | 10 |
1.2 需求分析与整理 | 对收集到的需求进行筛选、分类和优先级排序,形成完整的需求列表。 | 20 | 30 |
2.1 系统架构设计 | 设计软件的总体架构,包括前后端分离、模块划分(登录、主页、对话、百宝箱、使用指南)等。 | 15 | 45 |
2.2 界面设计与原型制作 | 设计软件的界面布局和交互方式,制作高保真原型供用户评审。 | 15 | 60 |
2.3 数据库设计与建模 | 根据软件功能需求,设计数据库表结构、字段和关系,建立数据库模型。 | 15 | 75 |
3.1 后端开发与接口编写 | 编写后端服务代码,实现数据处理、业务逻辑和API接口。 | 75 | 150 |
3.2 前端开发与页面制作 | 编写前端页面代码,实现界面展示和用户交互。 | 50 | 200 |
3.3 集成与初步测试 | 将前后端代码进行集成,并进行基本的功能测试和性能测试。 | 25 | 225 |
4.1 功能测试 | 对软件的所有功能进行全面测试,确保功能正确无误。 | 30 | 255 |
4.2 性能测试 | 对软件的响应时间、资源消耗等进行测试,确保满足性能要求。 | 20 | 275 |
4.3 缺陷修复与调优 | 根据测试结果修复软件中的缺陷,对性能瓶颈进行优化。 | 10 | 285 |
5.1 上线部署 | 将软件部署到服务器,配置相关的环境和服务。 | 15 | 300 |
5.2 用户培训与支持 | 对用户进行软件使用培训,提供技术支持和问题解决服务。 | 15 | 315 |
6.1项目收尾与总结 | 总结项目经验,整理文档资料,完成项目收尾工作。 | 15 | 330 |
6.2持续支持与维护 | 功能更新、安全维护、性能监控 | 持续 | 持续 |
2.1.2.2 讯飞星火
讯飞星火认知大模型是一款基于人工智能技术的认知智能大模型,功能丰富,包括了对话,友伴等基础功能,还包括了制作ppt,制作简历,插件选择等高级功能,对于一般的人工智能技术软件而言要复杂得多
阶段 | 主要活动 | 预计天数 | 累计天数 |
---|---|---|---|
项目启动 | 需求确认、团队组建、项目计划制定 | 15 | 15 |
概念设计与规划 | 用户研究、竞争对手分析、产品草图绘制(登录页面、主页、友伴页面、其他小功能页面) | 20 | 35 |
技术架构设计 | 技术选型、系统架构设计、数据库设计 | 35 | 70 |
开发实施 | 前端开发、后端接口设计、利用组件进行集成 | 80 | 150 |
UI设计与优化 | 用户界面原型设计、根据用户体验进行原型优化 | 30 | 180 |
测试与调优 | 系统测试、性能优化、Bug修复 | 45 | 225 |
用户验收 | 用户反馈收集、用户验收测试 | 25 | 250 |
部署与上线 | 服务器配置、数据迁移、系统部署 | 20 | 270 |
持续支持与维护 | 功能更新、安全维护、性能监控 | 持续 | 持续 |
2.1.2.3 一般竞品
一般AI问答软件项目虽然同样需要经历一系列阶段来确保项目的成功完成,但是不需要像大型项目那样复杂的规划和执行,也没有像以上两款产品——文心一言、讯飞星火有如此强大高级的功能去开发,因此一般竞品类似小型项目的进度表如下:
阶段 | 主要活动 | 花费时间 (天) | 累计时间 (天) |
---|---|---|---|
1. 计划 | 定义项目范围和目标 | 5 | 5 |
2. 研究 | 研究AI问答系统的技术和算法 | 10 | 15 |
3. 设计 | 设计系统架构和用户界面 | 7 | 22 |
4. 开发 | 开发AI问答算法和软件原型 | 20 | 42 |
5. 测试 | 进行系统测试和用户反馈 | 10 | 52 |
6. 修复 | 修复bug并进行最终调整 | 5 | 57 |
7. 部署 | 部署到生产环境并进行发布 | 3 | 60 |
8. 支持 | 提供用户支持和持续改进 | 持续 | 持续 |
2.2 同类产品对比排名(以文心一言与讯飞星火对比为例)
2.2.1 优劣描述
文心一言和讯飞星火都是功能丰富的语言处理软件,各有优势和不足,在第一部分已经探讨过文心一言与讯飞星火在数据量、界面、功能、准确度方面的优缺点分析,下面进行总结描述——
文心一言:
在数据量上依托庞大的训练数据集,具有良好的理解和记忆能力,能够处理复杂的问题,并且支持多种交互方式。然而,由于数据不足和时效性限制,有时可能会导致回答不够精确或全面。界面方面,尚未实现多维感官体验,存在一些功能实现方面的BUG。
讯飞星火:
拥有丰富的数据库和持续更新的优势,在翻译准确度和实时互译方面表现出色。界面设计简洁明了,用户友好,并且提供了多种形式的翻译功能。然而,数据量方面存在专业术语覆盖不足和语种有限的问题,部分功能可能不够完善,准确度在处理复杂语境时也有所限制。
PS:在做题方面,两个模型都有一些弱点~~(所以一定要不能过度依赖大语言模型,要好好学习,独立思考)~~
总之,两个中文语言大模型都各有各的优点,各自有自己的独特所在,但也存在不足仍由很长的一段路要走。
2.2.2 优劣对比表
下面通过表格对这两款人大模型进行更直观的优劣对比:
优劣对比:
类型方面 | 讯飞星火 | 文心一言 | 备注 |
---|---|---|---|
简单知识问答 | 正确,提供额外信息 | 正确 | 讯飞星火对问题进行了延伸 |
专业知识理解 | 详细 | 相当 | 星火略详细 |
情感性问题 | 稍弱,强调无情感 | 理解偏差 | NULL |
未来预测与影响 | 能力相当 | 能力相当 | 涉及未来预测,回答难度较大 |
数学推理 | 表现突出 | 理解逻辑错误 | 讯飞星火在数学能力上较强 |
文本生成与语言理解 | 能力相当 | 能力相当 | 正常情况下的文本生成与理解 |
回答速度 | 较快 | 相对较慢 | 讯飞星火在回答速度上更快 |
画图能力 | 不具备 | 具备 | 文心一言有独特的画图能力 |
额外功能 | 具有友伴、制作ppt、制作简历等多种功能 | 具备一言百宝箱、使用指南、画图等多种功能 | 两种模型功能丰富,但部分均存在bug |
与ChatGPT对比 | 有差距 | 有差距 | 两者都需要大力追赶GPT-4 |
2.2.2 排名
2.2.2.1 个人想法
🥇NO1——科大讯飞
🥈NO2——文心一言
2.2.2.2 研究所测评排名
而对于去年InfoQ研究所发布的《2023 大语言模型综合能力测评报告》,我们可以看到以下是国内当前主流的语言大模型:
研究中心对各家的大语言模型进行了综合测试后也发现,国外的 ChatGPT 各项能力确实很抗打,位居第一位。令人惊喜的是,百度的文心一言以及讯飞星火均闯进了前五名,文心一言位居第二,讯飞星火位居第四,而且值得一提的是,其文心一言综合得分仅落后 ChatGPT ,远超第三名 Claude,当然这都只是去年的研究数据,总体而言,科大讯飞星火模型和百度文心一言都有非凡的实力和巨大的发展前景,它们各有特点,虽然现阶段仍有不足,不过经过不断改进和优化,相信未来一定会发挥越来越重要的作用!:
2.3 软件工程方面的建议
软件工程方面 | 文心一言 | 讯飞星火 |
---|---|---|
数据管理 | 增加特定领域数据采集和更新频率 | 不断更新数据库,特别是针对专业术语和新兴词汇 |
引入实时数据流或动态更新机制 | 与专业机构和语料库合作,整合更多行业专业术语和新兴词汇 | |
确保数据充分覆盖和时效性 | 增加对少数语言的支持 | |
界面设计 | 引入视觉展示、视频等多媒体元素 | 继续保持用户界面简洁性,同时提供高级功能的直接访问 |
提供触觉反馈等功能(针对一言百宝箱的页面滚动改进) | 优化界面布局和用户体验 ,实现统一美(停止输出按键添加) | |
丰富用户交互体验 ,对于不同设备页面兼容性改进 | 加强设备兼容性测试 | |
算法与准确度 | 优化算法和模型,提高语言处理能力 | 通过技术迭代提高翻译准确度 |
加强情感分析和主观判断能力的训练 | 引入更先进的机器学习模型和人工智能技术 | |
功能扩展与优化 | 探索更高级别的自然语言处理技术 | 加强功能开发,特别是复杂句子和特定行业用语的翻译能力 |
提高情境理解能力(对于插件功能的改进) | 优化功能布局和用户指南 | |
BUG修复与稳定性 | 加强测试和审核流程,及时修复BUG | 提高软件稳定性,确保良好的用户体验 |
其他 | 提升上下文理解能力 | 提高离线翻译能力,减少对网络依赖 |
2.4 BUG存在的原因分析
软件团队未能在发布前修复的原因可能有很多种,并不一定意味着他们不知道或有意不修复。以下是一些我认为可能的原因:
- 时间限制:软件开发和测试通常都有严格的时间表。有时,尽管发现了bug,但由于时间紧迫,团队可能不得不优先保证软件的主要功能或性能,而暂时搁置一些非关键的bug。
- 技术难度:有些bug可能很难定位或修复,需要花费大量的时间和精力。在时间和资源有限的情况下,团队可能会选择先解决其他更容易修复的问题。
- 发布策略:在某些情况下,团队可能选择发布带有已知bug的软件版本,然后在后续版本中修复这些问题。这通常是因为团队认为这些bug不会对大多数用户造成严重影响,或者他们希望通过收集用户的反馈来更好地定位和解决这些bug。
总的来说,BUG存在的原因有很多,当然也有可能存在人员疏忽了某些BUG问题d额情况,团队里的所有人都遗漏了某个BUG,但是人无完人,可能有的BUG确实是很难发现,因此用户的反馈也很重要!为了提高软件质量,团队应该努力优化开发流程、加强团队协作和沟通,并尽可能在发布前修复尽可能多的bug!!
2.5 个人思考
文心一言是一款优秀的人工智能自然语言处理软件,能精准理解并回答各种问题,也注重用户体验,操作简单便捷,值得推荐。同时,作为讯飞星火的用户,我也深感其强大的语音识别技术和便捷的交互体验给我的学习和生活带来了无与伦比的便利。
在上面两个部分,我也提出了自己对于两个产品的改进建议,那么我很想了解到对于这两个软件开发团队而言,未来,他们对于自己的项目有哪些发展规划和改进方向? ;同时针对这两款软件模型,我觉得他们在安全性以及用户隐私方面做的很强,想询问一下在这个方面采取了哪些措施以保证安全问题?
第三部分 建议和规划
3.1 市场概况
市场规模:市场规模很难估计,但是随着大语言模型技术不断发展,需求会越来越多,市场正在逐渐扩大!
用户数量:直接用户可能覆盖百万人左右,而潜在用户数量可能更多,包括需要大规模自然语言处理技术支持的企业、研究机构、教育机构以及个人用户。
3.2 市场现状
目前市场上有很多类似产品,除了上文讨论的文心一言、讯飞星火,还有ChatGPT、Kimi、通义千问、Claude、Sage、天工等等,市场竞争还是相当强烈的.
3.2.1 产品的定位、优势与劣势体现
不同产品在定位、优劣势体现上可能有所差异——
文心一言是一款集知识增强、检索增强和对话增强于一体的智能语言模型,旨在通过对话互动、回答问题、协助创作等方式,为用户提供高效、智能和个性化的服务体验。同时,它以温暖治愈的定位,为用户带来心灵上的关怀和安慰。
优势 | 劣势 |
---|---|
高精度:准确理解用户输入,提供精准答案 | 创作内容缺乏深度和个性化:生成内容缺乏人类作家的情感温度和深度洞察 |
多语言支持:支持中文、英文、日文等多种语言 | 依赖大量数据训练可能导致偏见问题:数据偏见可能反映在生成的文本中,导致歧视性或误导性信息 |
快速响应:短时间内给出答案,提高用户体验 | 过分依赖可能抑制创造力:用户可能过于依赖其答案,减少自主思考和创造力 |
优秀算法:先进的自然语言处理算法,处理复杂语义 | 对新领域或专业知识的适应性有待提高:在某些特定领域或专业知识方面,可能仍需进一步提升准确性 |
可定制性强:根据用户需求进行个性化定制 | 数据安全和隐私保护问题:用户数据的安全性和隐私保护需要得到更加重视和保障 |
讯飞星火认知大模型是科大讯飞推出的一款人工智能产品,其产品定位主要聚焦于教育、医疗、工业等领域,致力于为用户提供智能化、个性化的解决方案。
优势 | 劣势 |
---|---|
技术领先:依托科大讯飞强大的研发实力,运用先进的深度学习算法和自然语言处理技术。 | 成本问题:研发和部署如此先进大型的语言模型需要昂贵的硬件和计算资源,可能导致成本上升。 |
多领域应用:设计考虑到多场景的应用,适用于教育、医疗、工业等多个领域。 | 数据隐私:处理大量个人或敏感数据时可能出现隐私保护的挑战。 |
数据处理能力:处理和分析大量文本数据,进行语音识别、语义理解及语言生成。 | 误解与错误:技术先进,但仍可能因算法局限或训练数据偏见产生误导或错误回答。 |
实时交互:实现与用户的实时交互,提供智能客服、教育辅导、即时翻译等服务。 | 依赖性:用户可能过度依赖模型的建议和判断,从而影响个人的决策能力和创造力。 |
持续学习与优化:通过不断的学习和接受新数据,性能和准确度持续提升。 | 泛化能力:对于未出现的新场景或少见领域的问题,泛化能力不足,应对较为困难。 |
用户体验:针对用户需求进行优化,提供便捷、直观的用户体验。 | 监管与伦理:人工智能的应用可能引发法律、监管和伦理问题,需要持续关注和解决。 |
3.2.2 产品关系及竞争态势分析
文心一言、讯飞星火、ChatGPT、Kimi、通义千问、Claude、Sage和天工等都是基于人工智能技术的自然语言处理模型,它们都能够以某种方式理解和生成人类语言。这些产品都在一定程度上具有相似的功能,例如文本生成、问答系统、机器翻译等,因此可以认为它们之间均存在竞品关系。
以文心一言、讯飞星火以及排行第一的ChatGPT为例进行竞争态势分析:
文心一言 vs 讯飞星火 vs ChatGPT
文心一言、讯飞星火和ChatGPT都是自然语言处理领域的知名产品,它们在语义理解、文本生成等方面都有一定的优势。竞争主要体现在其算法的准确性、速度和可靠性上。此外,它们的定位和应用场景可能会有所不同,比如文心一言可能更适用于短文本生成,讯飞星火则更注重语音识别和语义理解,而ChatGPT则在对话生成方面领先。
总之,这些AI产品之间的竞争是多方面的,不仅仅在于技术实力,还包括市场营销、品牌建设、合作伙伴关系以及对法律和社会变化的适应能力。每个产品都有其独特的优势和挑战,而且随着技术的不断发展,具体的竞争态势也可能发生变化。
3.2.3 判断行业发展阶段
我认为文心一言和讯飞星火两者都处于成长阶段。它们有着很大的发展潜力,可以通过不断的改进和创新来吸引更多用户,提升产品的竞争力。这对于公司和团队来说都是一个很好的机会,可以不断地完善产品,拓展市场份额。
3.3 市场与产品生态
3.3.1 对于文心一言
典型用户:
年龄:20-40岁
学历:大学本科及以上
专业:计算机科学,文学,新闻传播、金融、美术等
爱好:编码、阅读、写作
收入:学生可能无收入,但是上班族可能收入范围较广不好确定
表面需求:解决生活中存在的问题,学业工作上的疑问
潜在需求:高效准确解决学业工作上的疑问,以及数据的处理
3.3.2 对于讯飞星火
典型用户:
年龄:15-30岁
学历:初中及以上
专业:各种学科领域
爱好:外语、口语、写作等
收入:学生收入相对较低,上班人员可能刚步入社会,收入较低
表面需求:学业工作辅导
潜在需求:高效准确解决问题,独立完成疑惑
3.3.3 用户群体之间的关系与产品生态
3.3.3.1 关系
(1)重叠关系:从以上产品的用户群体描述可以看出,文心一言和讯飞星火的用户群体存在一定的重叠和相似之处,但也有一些在年龄范围、学历和专业以及收入状况存在明显的区别。
(2)递进关系:每个用户群体都存在递进关系,由于年龄范围跨度广,低年龄段的用户会在几年后变成中等年龄段的用户
3.3.3.2 二次构成特定用户生态的可能性
尽管存在一定的差异,但两个产品的用户群体都有解决学业工作上的疑问的需求,以及对高效准确解决问题的潜在需求。因此,可以考虑利用它们之间的相互作用,构建一个更广泛的用户生态系统,以满足用户更多样化的需求。可以通过整合文心一言和讯飞星火的功能,提供更全面的学习和工作辅导服务,从而吸引更多的用户并增强用户粘性。同时,还可以通过数据共享和交叉推荐等方式,实现用户之间的信息共享和交流,进一步促进用户生态系统的发展和壮大。
3.3.4产品的子产品与其他相关产品关系
3.3.4.1 关系
文心一言可能会有其他相关的插件选择功能或者专门制作AI图片的子产品,而讯飞星火可能会有与友伴功能或者智能制作ppt相关的子产品。
3.3.4.2 二次构成产品生态的可能性
可以考虑将这些子产品进行整合,构建一个更完整、多元的个人学习生态,为用户提供更全面的服务,增加生态广度。
3.4 产品规划
3.4.1 新增语音通话功能的NABCD分析
基于文心一言与讯飞星火这两款软件的基础功能,由于讯飞星火有提供出友伴功能,但是只能通过文字聊天,发送接收信息来实现,因此我想设计出语言通话聊天的功能。以下是以讯飞星火为例,增加的新功能的NABCD表:
需求 (Need) | 可行性 (Approach) | 收益 (Benefit) | 竞争 (Competition) | 交付 (Delivery) |
---|---|---|---|---|
用户可能希望通过语音与友伴进行更直接、实时的沟通。 | 设计一个集成到讯飞星火平台的语音通话功能,允许用户和友伴进行实时语音对话。 | 为用户提供更丰富的交互方式,增强用户体验和用户粘性。 | 对比市场上其他虚拟助手平台,如果大多数未提供语音通话功能,这将是一个竞争优势。 | 通过应用内更新推出语音通话功能,确保所有现有用户都可以方便地访问新功能。 |
在某些情况下,文本交流可能不够高效或者不足以传达情感。 | 利用讯飞的语音技术优势,确保高质量的语音传输和清晰的通话体验。 | 可以吸引那些偏好语音沟通的新用户。 | 通过提供独特的语音通话体验,可以在竞争中获得差异化的优势。 | 通过市场营销活动和合作伙伴关系推广新功能,以吸引新用户并提高品牌知名度。 |
在网络不便或者需要快速响应的情况下,语音通话可以提供更好的解决方案。 | 实现端到端的加密,保护用户通话的隐私安全。 | 开辟新的使用场景,如远程工作协助、教育辅导等,从而增加产品的市场范围。 | 设置客户反馈渠道,不断收集用户反馈,优化功能性能和用户体验。 |
这个创新不仅满足了用户对多样化沟通方式的需求,而且利用了讯飞在语音技术领域的核心竞争力,提高了用户的互动体验和应用的实际价值!
3.4.2 新版软件发布角色配置方案(四个月六个人团队)
如果我是项目经理,以下是一个我设计的关于新增语音通话功能的团队人员配置方案:
角色 | 人数 | 职责 | 时间线 |
---|---|---|---|
需求分析师 | 1人 | 与客户沟通以明确语音通话功能的需求,编写详细的需求文档,确保开发团队对功能有清晰的理解。 | 前4周专注于需求收集与分析。 |
项目经理 | 1人 | 负责整体项目规划、进度跟踪、风险管理以及协调各团队成员的工作。 | 全程参与,确保项目按时完成。 |
前端开发工程师 | 1人 | 负责实现用户界面及相关的前端逻辑,包括适配移动和桌面端的语音通话界面。 | 前8周完成主要开发任务,后续时间用于测试、修复bug并进行优化。 |
后端开发工程师 | 2人(这里需要其他角色共同完成) | 构建服务器端逻辑,确保语音数据的传输、处理和存储安全高效。 | 前10周完成核心功能的开发,之后进行测试、性能调优和bug修复。 |
QA工程师 | 1人 | 制定测试计划,执行测试用例,确保发现并报告缺陷,验证最终产品的质量。 | 在开发阶段末期开始测试,贯穿至项目结束,保证持续的质量控制。 |
UI/UX设计师 | 1人 | 负责设计和优化用户界面和用户体验,确保语音通话功能的界面设计符合品牌标准,同时具有良好的易用性和可访问性。 | 前4周与需求分析师紧密合作,确定用户界面需求和设计标准。随后根据开发进度提供设计资源,并在开发过程中持续优化设计。 |
3.4.3 详尽每周行动指南(总共16周)
周数 | 角色 | 主要任务 |
---|---|---|
第1-4周 | 需求分析师 | 进行市场调研,与利益相关者会议,定义语音通话功能的需求,并完成需求文档。 |
UI/UX设计师 | 根据确定的需求开始草拟初步设计概念和用户流程图。 | |
项目经理 | 制定整体项目计划,包括时间表、资源分配和风险管理计划。 | |
第5-8周 | UI/UX设计师 | 完成详细的语音通话界面设计,创建原型,并与前端开发工程师协作实现设计。 |
前端开发工程师 | 根据确定的设计方案开始实现用户界面及相关的前端逻辑。 | |
后端开发工程师 | 构建服务器端逻辑,设置必要的服务架构和数据库。 | |
QA工程师 | 制定测试策略和计划,准备测试环境和工具。 | |
第9-12周 | 前端和后端开发工程师 | 继续开发功能,完成语音通话功能的核心业务逻辑,并进行单元测试。 |
UI/UX设计师 | 收集用户反馈,调整设计细节,确保最佳的用户体验。 | |
QA工程师 | 随着功能的逐步完成,开始执行测试用例,发现并报告缺陷。 | |
第13-16周 | 前端和后端开发工程师 | 修复发现的缺陷,进行最后的代码审查和优化。 |
QA工程师 | 进行彻底的测试,包括集成测试、性能测试和安全测试。 | |
UI/UX设计师 | 最终确认界面设计和用户体验,准备发布前的最终审美检查。 | |
项目经理 | 管理最后阶段的进度,协调发布准备活动,并确保所有利益相关者对版本发布达成一致。 |