222100336潘岩 软件测评作业

这个作业属于哪个课程w班
这个作业要求在哪里软件工程实践——软件评测作业
这个作业的目标完成对几个ai软件的测评
其他参考文献

一、使用体验

文心一言

功能介绍

1.它拥有广泛的知识储备,能够回答用户提出的各种问题,无论是学科专业知识、百科知识还是生活常识,它都能够为用户提供准确的答案。

其次,它具备文本创作的能力,可以根据用户的需求生成各种类型的文本,如小说、文案、诗歌和作文等。无论是创意写作还是实用文本,它都能够胜任。

此外,它还能够进行知识推理和逻辑推理,帮助用户解决复杂的问题和进行思维训练。它的脑筋急转弯功能也能为用户带来轻松愉快的娱乐体验。

ai画图

请添加图片描述
请添加图片描述
请添加图片描述

文档生成

请添加图片描述

优缺点分析

优点

  1. 流畅的对话能力:文心一言能够生成连贯、自然的文本回复,与用户进行流畅的对话,提供类似于与真人交谈的体验。

  2. 广泛的知识覆盖:由于在训练过程中接触了大量的文本数据,文心一言具备广泛的知识基础,能够回答各种问题,从日常琐事到专业知识。

  3. 高效的信息检索:文心一言可以快速地从其知识库中检索信息,为用户提供所需的答案,大大提高了信息获取的效率。

  4. 多语言支持:文心一言支持多种语言,使其能够服务于不同语言背景的用户。

缺点
5. 理解的局限性:尽管文心一言在理解自然语言方面取得了显著进展,但它仍然无法完全理解复杂的人类情感和语境,有时可能无法提供完全准确的回答。

  1. 知识更新的滞后性:文心一言的知识库是基于训练数据集的,这意味着它可能无法获取最新的信息或事件,导致其回答可能不是最新的。
产品改进意见

优化算法,能适应递进类的要求,迭代的结果要求保持原有的要求

bug描述

  1. 测试环境:
  • 计算机版本:Windows 10 家庭版

  • 浏览器:Microsoft Edge

  • 时间:2024-04

  1. bug星级判定
性质判定星级
严重程序崩溃 影响电脑安全三颗星
一般结果出现乱码两颗星
轻微与要求无关联一颗星
  1. ai作图bug
  • 手指细节不清晰,左右手均为6根手指(两颗星)
    请添加图片描述

  • 无法完成要求作画请添加图片描述

bug改进建议

对于人的手指细节进行大模型训练

采访

  1. 采访对象:室友
    请添加图片描述

Kimi

功能介绍

  • 多语言对话 - 擅长中文和英文的对话,可以与用户进行流畅的交流。

  • 文件内容解析 - 用户可以将TXT、PDF、Word文档、PPT幻灯片、Excel电子表格等格式的文件发送给它,它可以阅读这些文件的内容并回答相关问题。

  • 网页内容分析 - 当用户提供网址时,可以解析网页内容并结合这些内容回答用户的问题。

  • 搜索能力 - 可以使用搜索功能来找到互联网上的信息,结合搜索结果来提供更全面的回答。

  • 信息提供 - 可以提供安全、有帮助、准确的信息,并且遵守相关法律法规。

  • 内容生成 - 不能创建文档,可以生成文字回复,帮助用户解决问题。

  • 遵守指令 - 会遵循用户的指令来回答问题,确保用户的需求得到满足。

解析网页内容

请添加图片描述

读取文件并回答问题

请添加图片描述

优缺点分析

优点:

  1. 多语言交流能力:能够在中文和英文之间进行流畅的对话和翻译,帮助不同语言背景的用户进行沟通。

  2. 信息处理速度:可以快速处理和分析大量信息,为用户提供及时的反馈和答案。

  3. 知识广泛:拥有广泛的知识库,可以回答各种类型的问题,包括科学、历史、文化等领域。

缺点:

  1. 情感理解有限:虽然能够处理自然语言,但在理解复杂的人类情感和语境方面仍有限制。

  2. 创造力不足:在需要高度创造性和原创性的任务上,可能无法与人类相比。

  3. 依赖数据和算法:回答质量受限于训练数据的质量和算法的准确性。

产品改进意见

优化算法,将所输出的文本进行美化,优化排版

二、分析

开发时间估计

产品时间估计
文心一言21周
Kimi19周

原因

  • 需求分析和规划(1-2周):

确定聊天机器人的目标、功能和用户群体。
制定详细的项目计划和时间表。

  • 技术选型和原型设计(1-3周):

选择合适的技术栈和开发工具。
设计聊天机器人的对话流程和用户交互原型。
开发初步的原型并进行内部测试。

  • 开发和集成(4-12周):

根据原型开发完整的聊天机器人功能。
集成自然语言处理(NLP)和机器学习(ML)组件以提高对话理解能力。
开发后端服务以支持聊天机器人的运行。
UI/UX设计和前端开发以确保良好的用户体验。

  • 测试和迭代(2-4周):

进行广泛的测试,包括单元测试、集成测试和用户验收测试。
根据测试反馈进行迭代和优化。

  • 部署和维护(1-2周):

部署聊天机器人到目标平台。
准备后续的维护和更新计划。
团队协作和沟通:

团队成员之间的有效沟通和协作对项目的成功至关重要。
定期举行会议和评审,确保项目按计划进行。

同类产品对比

  • 文心一言在功能上可以ai生成图片,但是未连接网络,无法读取网页内容;Kimi可以读取网页内容,但是无法生成图片,也没有编程功能
特点文心一言chatgptKimi
学习能力8108
答案满意度695
功能多样性675
排名213

软件工程方面的建议

ai作图方面的完成程度还不够成熟,模型训练的数据还不够完整,上市很长一段时间依然没有改善,说明训练模型的数据没有及时更新。

bug存在的原因分析

测试样本不够多,种类和数量都还不够,测试时间不够长

三、建议和规划

市场概况

  1. 首先市场有多大?

在自然语言处理领域有很大的市场。随着人们对人工智能和自然语言处理技术的需求不断增长,ChatGPT等大型语言模型可以应用于多个领域,如智能客服、虚拟助手、内容生成、语言理解等。这些应用可以提供更加智能、快速和高效的解决方案,因此受到许多企业和组织的青睐。

除了商业应用外,还可以应用于教育、医疗、娱乐等领域,为人们提供更好的服务和体验。

市场现状

  1. 目前市场上有什么样的产品了?

有ChatGPT、Kimi、文心一言、通义千问、讯飞星火等

  1. 上述产品的定位、优势与劣势在哪里?

1、定位:

定位于提供高质量的自然语言处理服务,包括文本生成、文本理解和对话交互等领域。
它可以应用于智能客服、虚拟助手、内容生成、情感分析等多个领域,为用户提供更智能、更便捷的服务。

2、优势:

语言理解能力强:大型语言模型,具有很强的语言理解能力,能够生成具有语法正确性和语义连贯性的文本。
通用性强:可以适用于多种自然语言处理任务,不需要针对特定任务进行训练,具有很强的通用性。
易用性高:提供了简单易用的API接口,可以方便地集成到各种应用程序中。
持续更新:由于是基于大规模数据训练的,因此可以通过持续的数据更新来提升性能和准确性。

3、劣势:

缺乏领域专业知识:由于是通用模型,缺乏针对特定领域的专业知识,可能在某些特定领域的任务上表现不佳。
对话连贯性不足:尽管在生成文本方面表现很好,但在长对话场景下可能会出现逻辑不连贯或话题跳跃的问题。
数据隐私问题:由于ChatGPT是基于大规模数据训练的,存在一定的数据隐私和安全风险,需要谨慎处理用户数据。

  1. 这个领域正处于 (萌芽 / 成长 / 风口 / 平台 / 下降)阶段?

这个领域可以说处于成长阶段。自然语言处理和人工智能技术在近年来取得了长足的发展,越来越多的企业和组织开始意识到这些技术的重要性,并将其应用于各种场景中。ChatGPT等大型语言模型的出现和不断进步,进一步推动了这个领域的发展。未来,随着技术的不断进步和应用场景的不断拓展,这个领域的发展潜力仍然巨大。

市场与产品生态

  1. 这个产品的核心用户群是什么样的人?典型用户是什么样的?学历,年龄,专业,爱好,收入,表面需求,潜在需求都是什么?

ChatGPT这类自然语言处理产品的核心用户群体比较广泛,主要包括以下几类人群:

  1. 开发者和技术人员:这是最显而易见的用户群体,他们可能使用ChatGPT来构建智能应用程序、开发聊天机器人等。

  2. 研究人员和学生:这些用户可能使用ChatGPT进行自然语言处理研究、开展实验等。

  3. 内容创作者:包括博主、作家、记者等,他们可能使用ChatGPT生成内容灵感、扩展文章等。

  4. 教育工作者:教师、教育机构可能使用ChatGPT提供个性化教育、答疑解惑等服务。

  5. 企业和组织:包括各行各业的企业和组织,他们可能使用ChatGPT提供客户服务、信息查询、数据分析等功能。

典型用户可能具有以下特征:

  • 学历:本科及以上学历,主要集中在计算机科学、人工智能、语言学等相关专业。
  • 年龄:年龄跨度较大,但主要集中在25岁以上,具有一定工作经验和需求。
  • 专业:技术类和研究类专业居多,但也包括其他专业领域。
  • 爱好:对新技术和人工智能感兴趣,喜欢尝试新事物,有探索精神。
  • 收入:收入水平相对较高,有一定的消费能力。
  • 表面需求:获取自然语言处理技术的应用、解决实际问题、提高工作效率等。
  • 潜在需求:提高工作生产力、获得新的工作方式和思路、创造性地解决问题等。
  1. 产品的子产品,以及其他相关产品之间是否存在一定的关系?是否有利用各个产品特性之间的相互关系二次构成产品生态的可能性?

对于ChatGPT这样的产品,可能存在一些子产品或相关产品,它们之间可以有一定的关系,也可以构成一个完整的产品生态系统。以下是一些可能的子产品或相关产品:

  1. ChatGPT API:提供给开发者使用的API,用于集成ChatGPT功能到他们的应用程序中。

  2. ChatGPT插件:为各种应用程序提供的插件,可以方便地将ChatGPT功能集成到这些应用程序中。

  3. ChatGPT定制服务:为企业和组织提供的定制化服务,根据他们的需求定制ChatGPT功能。

  4. ChatGPT教育版:针对教育领域的版本,提供特定的教育功能和内容。

  5. ChatGPT内容生成工具:帮助内容创作者生成文章、故事等内容的工具。

这些产品之间可以有一定的关系,例如,ChatGPT API可以为ChatGPT插件和定制服务提供基础功能支持;ChatGPT插件和定制服务可以扩展和定制ChatGPT的功能;ChatGPT教育版可以基于ChatGPT API开发,提供特定的教育功能。

通过利用各个产品特性之间的相互关系,可以构建一个更加完整和有价值的产品生态系统,满足不同用户群体的需求,并提供更广泛的应用场景。

产品规划

新功能

在当前的ChatGPT软件基础上,我可以设计以下新功能:

  1. 情感分析功能:通过对用户输入文本的情感进行分析,提供情感倾向的判断和建议,帮助用户更好地了解和管理自己的情绪。

    • 为何要做这个功能:情感分析可以帮助用户更好地理解自己的情绪状态,有助于情绪管理和心理健康。
    • 为什么用户会用这个功能:用户可以通过情感分析了解自己的情绪倾向,从而采取适当的行动调整情绪状态,提高生活质量。
    • 创新点在哪里:与传统的情感分析工具相比,ChatGPT可以提供更加智能和个性化的情感分析,能够更好地理解用户的情感表达。
  2. 内容推荐功能:根据用户的历史使用记录和偏好,推荐相关的文章、新闻、视频等内容,提供个性化的信息服务。

    • 为何要做这个功能:内容推荐可以帮助用户发现更多有价值的内容,提高用户的阅读和浏览体验。
    • 为什么用户会用这个功能:用户可以通过内容推荐发现新的内容,满足自己的信息需求,节省搜索时间。
    • 创新点在哪里:ChatGPT可以通过对用户的对话和使用记录进行分析,提供更加精准和个性化的内容推荐,帮助用户发现更有价值的内容。
  3. 知识问答功能:基于ChatGPT强大的自然语言处理能力,提供更加智能和准确的知识问答服务,帮助用户解决各种问题。

    • 为何要做这个功能:知识问答可以帮助用户快速找到答案,解决问题,提高工作和生活效率。
    • 为什么用户会用这个功能:用户可以通过知识问答功能快速获取准确的答案,节省时间和精力。
    • 创新点在哪里:ChatGPT可以结合大量的知识库和数据,提供更加全面和准确的答案,具有很高的智能化程度。

决赛配置

  1. 项目经理(1人):负责项目整体规划、组织协调、进度控制和团队管理。

  2. 软件开发工程师(3人):负责软件的开发、编码和测试工作,确保软件功能的实现和质量。

  3. 测试工程师(1人):负责软件的测试工作,包括功能测试、性能测试、兼容性测试等,确保软件质量。

  4. UI/UX设计师(1人):负责软件的用户界面和用户体验设计,提升软件的易用性和吸引力。

  5. 产品经理(1人):负责产品需求分析、功能设计和用户反馈收集,确保软件满足用户需求。

在角色配置上,需要重点关注软件开发和测试工作的人员配备,确保在有限的时间内完成软件开发和测试,并保证软件质量。同时,UI/UX设计师和产品经理的配备也很重要,以确保软件的用户界面设计和功能设计符合用户需求和预期。

在第16周如期发布软件改进版本并取得预期成绩的关键在于合理的时间规划、团队协作和高效的工作执行。因此,建议在项目启动时制定详细的项目计划,明确各项工作的时间节点和责任人,定期进行进度跟踪和风险管理,及时调整和优化工作计划,确保按时发布软件改进版本并取得预期成绩。

16周规划

第1-2周:项目准备阶段

  • 确定项目范围和目标
  • 分配团队角色和职责
  • 制定项目计划和时间表
  • 收集和分析需求文档

第3-4周:需求分析阶段

  • 完成需求分析文档
  • 确定软件功能和特性
  • 确定用户界面设计方案

第5-8周:设计和开发阶段

  • 进行软件架构设计
  • 进行用户界面设计
  • 开发核心功能模块
  • 进行单元测试和集成测试

第9-12周:测试和优化阶段

  • 进行功能测试和性能测试
  • 修复和优化软件缺陷
  • 完善用户界面和用户体验
  • 进行用户验收测试

第13-14周:版本发布阶段

  • 准备发布版本的软件包
  • 进行最后的测试和验证
  • 发布软件改进版本

第15-16周:版本迭代和反馈阶段

  • 收集用户反馈
  • 分析用户数据和行为
  • 计划下一版本的改进和更新
  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值