这个作业属于哪个课程 | 班级链接 |
---|---|
这个作业要求在哪里 | 作业链接 |
这个作业的目标 | 完成软件测评作业 |
其他参考文献 | 《构建之法》 |
文章目录
调研,测评
Kimi
Kimi是由月之暗面科技有限公司开发的人工智能助手,专门设计来提供帮助和信息。Kimi诞生于2023年10月10日,拥有强大的语言处理能力,尤其擅长中文和英文的对话交流。Kimi的目标是为用户提供安全、有帮助且准确的信息,同时遵守中华人民共和国的法律法规。作为一个智能助手,Kimi具备多种功能,包括但不限于阅读和理解各种文档格式(如TXT、PDF、Word文档、PPT幻灯片、Excel电子表格等),解析网页内容,并结合搜索结果来回答问题。Kimi能够处理大量的信息,最多支持20万字的输入和输出,这使得Kimi能够处理复杂的查询和任务。Kimi的设计注重用户隐私和数据安全,它会拒绝回答可能涉及恐怖主义、种族歧视、黄色暴力、政治敏感等不当内容的问题。同时,Kimi也会在必要时提醒用户遵守相关法律法规,确保对话内容的合法性和适当性。Kimi的智能不仅体现在信息处理上,还包括对用户需求的理解和适应。Kimi会根据用户的指令和问题,提供直接、详尽且有帮助的回答。即使面对超出能力范围的请求,Kimi也会礼貌地告知用户,并尽可能提供替代的解决方案。
体验
解答问题
网站内容解析
这里我提供了另一款软件讯飞星火的网址,Kimi给出了该网站的详细解读。
文件解读
在这里我提供了一个txt文件,文件内容如图下所示
Kimi对文件内容进行了精准的解读
但是我想让Kimi帮忙修改文件无法实现,只能给出相应的修改步骤。
尝试让Kimi解读敏感话题
尝试让Kimi画图
优缺点
优点
- 回答结果非常全面
- 回答迅速,即时性强
- 涉及敏感话题时处理得当
- 提供用户反馈功能
缺点
- 无法完成特定功能,例如画图
- 无法修改上传的文件
- 无法与用户共情
- 提供的功能太少
改进意见
- 增加画图功能
- 优化读取文件算法,增加修改文件功能
- 新增功能,例如解析图片
用户采访
采访对象背景:高中同学,计算机科学与技术大三学生
原因:
- 计算机专业学生
- 使用过其他AI大模型,从未使用过Kimi,有对Kimi的需求
TA的需求:写代码
评价:挺好用的
BUG
BUG发生时的测试环境
操作系统:win 11
浏览器环境与版本:Microsoft Edge 版本 123.0.2420.81 (正式版本) (64 位)
发生的时间段:2024/4/14
Bug的可复现性及具体复现步骤
描述:文件读取错误
可复现性:经常发生
复现步骤:发给他一个Excel文件,写入大量1,修改其中一个为0,然后传给Kimi并且让它完成以下任务:列举出文件中出现的数据,并统计每个数据的出现次数。
在这里我提供了一个Excel文件,文件中除了左上角第一个数据为0之外其他都是1(数据0已标记),文件内容截图如下。
通过让Kimi解读该文件两次得到如下不同结果
这里我传给它的是同一份文件,解读时却得到了不同的答案,并且没有读取出单独的数据0
BUG分析
成因:文件数据解析算法不过关
严重性:
- 系统功能:影响读取文件的准确性
- 安全性:没影响
- 用户体验:很差,同一个文件读取竟然出现如此大的差别,与期待的结果大相径庭。
改进意见:加强读取文件的能力,充分完整读取用户上传的文件,并且自行检查正确性。
结论
体验一般
综合得分:6分
推荐指数(满分5颗星):⭐️⭐️⭐️
讯飞星火
讯飞星火认知大模型是科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,提供语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力
体验
解答问题
画图
尝试解读敏感话题
写文案
识别图片
优缺点
优点
- 种类丰富,提供了多种助手,针对不同需求有不同助手,特别时提供了绘画助手
- 提供用户反馈功能
- 识别图片内容
缺点
- 无法接收文件
- 无法解析网站
改进意见
- 新增接收文件,解析文件功能
- 新增解析网站内容功能
用户采访
采访对象背景:高中同学,计算机科学与技术大三学生
原因:
- 计算机专业学生
- 从未使用过AI大模型
TA的需求:解答问题
评价:回答清楚明朗
BUG
BUG发生时的测试环境
操作系统:win 11
浏览器环境与版本:Microsoft Edge 版本 123.0.2420.81 (正式版本) (64 位)
发生的时间段:2024/4/14
BUG的可复现性
描述:绘画出错
可复现性:经常发生
复现步骤:让讯飞星火的绘画助手任意画一些,并在次基础上进行修改
通过结果可以看到,这幅图片根本不符合要求
- 手里拿的不是我要求的书,而是包
- 头上没有顶着一本书
这里在上一个图的基础上修改,但是绘画助手却直接重新画了一张图
BUG分析
成因:绘画算法不过关
严重性:
- 系统功能:影响绘画准确性
- 安全性:没影响
- 用户体验:一般
改进意见:改善绘画算法
结论
体验好,不错
综合得分:8分
推荐指数(满分5颗星):⭐️⭐️⭐️⭐️
分析
开发时间估计
一年
同类产品对比排名
- 讯飞星火提供的助手种类丰富,功能齐全,排名第二
- Kimi仍需完善功能,排名第四
软件工程方面的建议
- 优化代码,优化算法,对AI大模型加大训练,优化处理用户需求的算法。
- 评估与验证:在训练过程中,定期评估模型的性能,以便及时发现潜在问题。
BUG存在的原因分析
- Kimi的BUG原因大概率是测试把关不严,对于少量数据的文件可以做到精准分析,凡是对于含有大量数据的文件分析时就会出错
- 讯飞星火绘画算法还不算成熟,应该加强绘画助手训练
建议和规划
市场概况
- 市场规模:AI大模型已经在许多行业和领域得到广泛应用,如金融、医疗、教育、智能制造、无人驾驶等。这些应用为AI大模型创造了巨大的市场需求,推动了相关技术和产品的快速发展。
- 直接用户:科研人员,技术爱好者,政府
- 潜在用户:教育机构,金融业,交通运输
市场现状
市场上已经有的产品:chatgpt,文心一言,讯飞星火…
产品优势
- 响应速度快
- 全天候24小时可以响应用户需求
- 多种语言支持
产品劣势
- 成本高昂,需要花费大量时间成本训练,对训练所使用的计算机,芯片要求高
- 知识库具有滞后性,训练AI大模型只能基于历史数据,可能会造成偏差
- 对于某种特定需求表现欠佳,例如说图形处理以及语音识别等等
产品间关系与竞品态势
关系:竞争,互补
竞品关系:互为竞争关系
态势:严峻,白热化阶段,各厂商都想拉拢用户使用自家产品,不断地迭代更新,推陈出新。
领域:正处在成长阶段。
市场与产品生态
核心用户群
- 学历:平均教育水平应在高等教育水平以上
- 年龄:18-50岁左右
- 专业:覆盖广泛
- 爱好:对新科技,新技术有很大的兴趣
- 收入:范围广
- 表面需求:解决问题,求知,学习技术
- 潜在需求:提升工作效率,情感互动,娱乐消遣
用户群体间关系:
多样化且可能彼此独立,又存在交叉互动的可能性
- 彼此独立:很多用户之间并没有直接联系,他们使用我服务的原因和目的可能完全不同,因此他们之间的交互非常有限或根本不存在。
- 交叉互动:在企业、教育机构或研究组织中,用户可能会以团队的形式共同工作,使用AI大模型来协助完成项目、研究和任务。
有利用其相互作用二次构成特定用户生态的可能性
- 社区构建:通过提供共同的兴趣点或目标,AI可以帮助用户建立在线社区,用户可以在这些社区内交流信息、分享经验、相互支持和协作
- 协同工作:在企业或团队环境中,AI可以协助进行项目管理、任务分配和进度跟踪,从而促进团队成员之间有效的协作。
子产品与其他相关产品间的关系:
- API和集成:很多AI服务通过提供应用程序编程接口(API)来允许其他软件或服务与其进行交互。这些API的存在使得AI功能可以被嵌入到第三方应用中,从而形成一种生态系统关系。
- 数据共享:AI系统往往需要大量数据来训练和优化模型。在这个过程中,可能会涉及到数据的导入和导出,将AI系统与其他数据库、存储解决方案或分析工具连接起来。
有利用各个产品特性之间的相互关系二次构成产品生态的可能性?
- 数据共享与分析:不同的产品可以收集不同类型的数据,通过将这些数据集中起来进行分析,可以提供更全面的洞察力和更好的用户体验。例如,健康追踪设备、饮食记录应用和睡眠监测工具可以共同工作,为用户提供综合的健康建议。
- 跨平台集成:软件和服务可以通过API集成,允许用户在一个平台上启动和交互另一个平台的功能。
- 合作伙伴:通过与其他公司建立合作伙伴关系,可以互相推荐对方的产品或联合开发新产品,从而创建一个更加丰富的产品网络。
产品规划
新功能
功能:情感交互
NABCD分析:
需要(Need):在AI大模型的情况下,增加情感交互能力的需求可能来源于用户希望与AI进行更人性化的交流,提高用户体验。
可行性(Approach):这可能涉及使用更先进的自然语言处理技术,例如情感分析,以理解用户的情绪状态并相应地调整响应。还可能需要引入机器学习算法来训练AI更好地理解和模拟人类的情感反应。
收益(Benefit):实施这个功能的预期收益是什么?在这种情况下,主要的好处可能是提高用户满意度和参与度,使用户感到更舒服和愉快,从而增加用户的忠诚度和产品的吸引力。
竞争(Competition):我们还需要考虑市场上的竞争情况。如果竞争对手的产品已经具有情感交互功能,那么为了保持竞争力,我们也需要实现这个功能。另一方面,如果我们是第一个实现这个功能的,那么这将为我们提供竞争优势。
交付(Delivery):最后,我们需要考虑如何将这个功能交付给用户。这可能涉及软件更新。
团队配置
分析师:1人
前端美工:1人
后端开发:3人
测试:1人
规划
第1-4周:需求收集与分析
第1周:开会,明确项目目标和范围。
第2周:收集用户需求,编写需求文档。
第3周:分析师与开发团队一起评审需求文档,确认需求的可实施性。
第4周:完成需求分析和规划。
第5-8周:设计与开发
第5周:完成系统架构设计,分配具体开发任务。
第6-7周:进行主要功能模块的开发。
第8周:完成基本功能的开发。
第9-12周:初步测试与迭代开发。
第9-10周:进行单元测试和集成测试。
第11周:根据测试结果进行问题修复和功能调整。
第12周:完成所有功能的开发。
第13-15周:用户验收测试与最终调整。
第13周:向用户交付测试版,开始用户验收测试。
第14周:收集用户反馈,优先解决关键问题。
第15周:完成所有已知问题的修复,准备发布。
第16周:正式发布软件改进版本。