这个作业属于哪个课程 | 软件工程实践-2023学年-W班 |
---|---|
这个作业要求在哪里 | 软件工程实践-软件评测作业 皱欣老师–软件工程 案例分析作业 |
这个作业的目标 | 通过分析软件来全面地了解软件工程的原理在软件上所起的作用 |
其他参考文献 | 无 |
文章目录
第一部分 调研,评测
讯飞星火
介绍
讯飞星火是科大讯飞推出的新一代认知智能大模型,具备多种语言理解和生成能力,
能进行内容生成、知识问答、推理、数学操作等,持续从大量数据和知识中学习进化。
体验
提问
否定其回答后,设定需求,它还是正确回答问题
要求使用Vue3的组合式API编写一个loginForm组件
运行结果展示
提供一些关键词
BUG
实验环境
- 操作系统:Windows 10 家庭中文版 22H2 19045.4291
- 处理器: 11th Gen Intel® Core™ i7-11800H @ 2.30GHz 2.30 GHz
- 浏览器环境:Chrome Version 123.0.6312.122 (Official Build) (64-bit)
BUG 1-功能迷糊
这边提到可以让AI开始LOGO设计的草图创作
当时间过去十几分钟后,我询问其结果,被告知它并不能提供一个LOGO
BUG 2-无法检查页面代码
点击F12打开浏览器的开发者工具后,页面代码会清空,只剩下空白。
在登录界面就打开开发者工具后,登录进去依旧是空白
不管是哪种情况,即使关闭开发者工具,刷新界面依然显示空白,且无法通过前进后退恢复。(上述现象已通过多次测试)
可能原因:开发者工具在运行时会对页面进行重新渲染和加载,导致之前的内容被清空。
BUG 3-放大后无法查看内容
放大到400%后,在这里无法通过滚轮向上查看对话信息,且无法选择对话信息
可能原因: 对话框使用了内部的滚动条,放大到400%后鼠标无法获取对话框焦点
BUG 4-无法切换插件
无法通过文字输入或者点击插件按钮进行切换插件或者取消使用插件,且不支持多个插件
可能原因:技术不支持
改进意见
- 页面布局,提供手机版浏览模式
- 建议可以查看页面源代码
结论
讯飞星火在回答问题、编写前端代码时具有不错的正确率,且会坚持正确的答案。
功能缺点:
- ppt插件:如果没有详细说明制作一份ppt,就会按照正常的问答来处理。
- 问答:当回答的内容过长时,超过某个限度后会清空内容,然后报错。
- 助手:存在助手对于自身功能认知错误的问题
界面缺点:
- 打开开发者工具后页面会清空
如果只是需要问答功能的话,不建议使用讯飞星火,如果要使用插件功能,可以尝试。
Kimi
介绍
Kimi是一款多功能的人工智能助手,能够理解和回应中英文对话,提供信息查询、文件内容解析、网页信息提取等服务,旨在帮助用户高效解决问题。
体验
正确通过
BUG
没有发现BUG
改进意见
可以逐步开发出插件功能
结论
如果没有特殊需求,目前来说kimi回答问题的正确率算是最高的,基本不会出问题,界面也很简洁,适配手机版,适合用于取代chatgpt3.5,推荐使用。
采访
采访对象为通信工程专业的大二学生
第二部分 分析
开发时间估计
阶段 | 活动 | 月估计/6人 | 备注 |
---|---|---|---|
前期准备 | 需求分析与规划 | 2 | 包括定义目标、性能指标等 |
数据收集 | 2 | 取决于数据的可用性 | |
数据清洗和格式化 | 2 | 根据数据质量和规模调整时间 | |
数据标注(如果需要) | 4 | 取决于数据量和复杂性 | |
模型构建 | 选择算法和技术栈 | 1 | 根据团队经验和项目需求选择 |
设计模型架构 | 2 | 包括初步设计和实验框架搭建 | |
初步模型训练 | 2 | 根据模型复杂度调整时间 | |
超参数调优 | 2 | 可能需要多次迭代 | |
特征工程和模型优化 | 3 | 根据模型表现进行调整 | |
质量保证 | 编写测试用例 | 1 | 确保覆盖所有关键功能 |
进行模型测试 | 2 | 包括单元测试和集成测试 | |
分析测试结果和调优 | 2 | 根据测试反馈进行必要的调整 | |
实施与运维 | 准备部署环境 | 1 | 包括硬件和软件的配置 |
部署模型到生产环境 | 1 | 确保部署流程顺利 | |
建立监控系统 | 1 | 用于跟踪模型性能和用户反馈 | |
监控模型性能和用户反馈 | 持续过程 | 持续监控和维护是必要的 | |
持续发展 | 收集用户反馈 | 持续过程 | 用于指导后续的迭代和优化 |
定期回顾和更新模型 | 每1-2个月 | 根据业务发展和用户需求进行 | |
优化和扩展模型功能 | 根据需求调整 | 可能需要额外的资源和时间 | |
合规与伦理 | 审查数据隐私和安全性 | 1 | 确保符合法律法规和公司政策 |
确保模型公平性和透明度 | 2 | 包括定期的审查和调整 | |
持续监控合规性和伦理问题 | 持续过程 | 需要团队成员的持续关注和努力 |
同类产品对比排名
排名 | 产品名称 | 优点 | 缺点 | 综合评分 |
---|---|---|---|---|
1 | Kimi | 强大的中英文对话能力、优秀的理解和生成文本能力、遵守法律法规和伦理标准 | 作为新兴产品,市场认知度有待提高 | 4.2/5 |
2 | 通义千问 | 执行效率高、多语言支持、强大的数学计算能力 | 插件较少、用户界面待优化 | 4.5/5 |
3 | 文心一言 | 优秀的中文处理能力、提供AI绘图功能 | 数学计算能力相对较弱、有时逻辑错误 | 4.0/5 |
4 | 讯飞星火 | 语音输入能力、实时对话响应 | 上下文理解能力有待提升、数学解答错误概率较高 | 3.5/5 |
讯飞星火的语音输入和实时对话响应能力是其一大亮点,提供了便捷的交互方式。但是,上下文理解和数学解答的准确性方面仍有较大的提升空间。
综合评分是根据各项性能测试、用户反馈以及市场影响力等多方面因素综合评定的,每款产品都有其独特的优势和改进空间,用户可以根据自己的需求进行选择。
软件工程方面的建议
- 增强数据预处理:
优化数据清洗和标注流程,确保训练数据的质量和一致性。
引入更先进的数据增强技术,以提高模型对不同语境和场景的适应性。
采用更精细的数据标注方法,确保上下文信息和数学概念被准确捕捉和理解。
- 改进特征工程:
利用自然语言处理(NLP)的最新研究成果,提取更有效的特征表示。
探索和实验不同的特征选择方法,以识别对模型性能影响最大的特征。
采用深度学习技术,如预训练语言模型,来捕捉复杂的语言特征和上下文关系。
- 强化模型训练:
使用更复杂的网络结构或集成学习方法,以提高模型的泛化能力和准确性。
实施持续的模型评估和迭代,确保模型在不断变化的数据分布上保持高性能。
引入领域专家知识,对模型进行微调,特别是在数学和逻辑处理方面。
BUG存在的原因分析
-
对于放大400%后无法查看对话框的消息,属于设计质量不高的问题,需要开发出移动端页面进行适配。
-
对于打开浏览器的开发者工具后页面清空的问题,可能是安全性考虑吧,不太能理解。
第三部分 建议和规划
市场概况
-
市场有多大
据大模型之家的测算,预计到2023年,全球人工智能大模型市场规模将达到210亿美元,并且预计随着大模型的进一步发展和技术的不断创新,到2028年,大模型市场规模有可能达到1095亿美元。
国际数据公司(IDC)预测,全球AI计算市场规模将从2022年的195.0亿美元增长到2026年的346.6亿美元。其中,生成式AI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元。
另一份报告预测,按收入计,2023年全球AI大模型收入大约为数百亿美元,预计到2030年将达到更高的数额,期间年复合增长率CAGR为一定百分比 -
直接用户量和潜在用户量
从2022年9月到2023年8月,排名前50位的AI工具产生了超过240亿次访问量,其中ChatGPT占据了140亿次流量。这些数据表明,AI大模型的直接用户量已经达到了数亿级别,因为即使只有一小部分用户是活跃的,考虑到重复访问和多个工具的使用,实际用户量也可能达到数千万。
全球已有5%的企业在使用大模型,预计到2026年,这一数字将达到80%。考虑到全球企业数量和个人用户,潜在用户量可能达到数十亿级别。
市场现状
序号 | 产品名称 | 开发者/公司 | 特点 |
---|---|---|---|
1 | Stable Diffusion | Stability AI, CompVis, LAION | 文本到图像潜在扩散模型,需下载代码部署使用 |
2 | DALL·E 3 | OpenAI | AI图像生成器,需chatGPT Plus会员才能体验 |
3 | Imagine with Meta AI | Meta (Facebook) | AI图像生成器,目前免费 |
4 | Imagen 2 | Google Deepmind | AI图像生成模型,效果待验证 |
5 | Stable Audio | Stability AI | AI音频生成模型 |
6 | MuseNet | OpenAI | AI音频生成模型 |
7 | Suno AI | Anthropic | 音频大模型,可以根据prompt和歌词完成谱曲和编曲 |
8 | Gemini Nano | DeepMind | 谷歌Gemini的口袋版,参数量3.2B |
9 | Phi-2 | Microsoft | 小语言模型,参数量2.7B,开源 |
10 | Llama | Meta (Facebook) | 开源大模型,发布了第2.0版本 |
11 | Vicuna | UC Berkeley等高校 | 模型参数量13B、7B,后来增加了33B的版本,目前版本为v1.5 |
12 | Mistral | MistralAI | 法国大模型初创企业发布的模型,参数量7B |
13 | Starling | UC Berkeley | 模型参数量7B |
14 | Gemma | 开源小语言模型,参数量为2B和7B | |
15 | DBRX | Databricks | 开源大语言混合专家(MoE)模型,参数量为132B,每次输入激活的参数36B |
16 | 零一万物 | 零一万物 | 开源大模型,参数数量为6B和34B,有基座版、微调版和量化版 |
17 | Qwen | 通义千问 | 开源版本,参数数量为1.8B/7B/14B/72B,2024年3月底发布了MoE版本 |
18 | DeepSeek | 幻方团队 | 开源大模型,DeepSeek-LLM的参数数量为7B和67B |
19 | 文心一言 | 百度 | 首批通过备案的人工智能大模型,提供文案生成、多轮会话等功能 |
20 | 云雀大模型 | 字节跳动 | 专为电商和生活服务场景设计 |
21 | 日日新大模型 | 商汤科技 | 认知大模型,以中文为核心的新一代认知智能大模型 |
22 | 百川大模型 | 百川智能 | 跨领域的知识和语言理解能力 |
23 | 智谱GLM大模型 | 智谱AI | 支持32K的上下文长度,能满足更长的多轮对话、知识问答与摘要等需求 |
24 | ABAB大模型 | MiniMax | AI大模型产品,具体特点未提供 |
25 | 书生通用大模型 | 上海人工智能实验室 | 首批通过备案的人工智能大模型 |
市场与产品生态
典型用户是那些教育水平较高、对新技术有热情、在专业领域有实际需求、并且愿意为高效和创新的解决方案投资的个人或企业。随着AI技术的不断发展和普及,这一用户群体可能会进一步扩大,涵盖更多行业和背景的用户。
用户群体之间存在以下关系,并且可以利用这些关系构建特定的用户生态系统
- 开发者与业务用户:开发者创造应用,业务用户使用这些应用,双方互动促进产品优化。
- 行业专家与应用开发者:行业专家提供领域知识,帮助开发者开发更符合行业需求的AI解决方案。
- 数据科学家与决策者:数据科学家利用AI模型分析数据,为决策者提供洞察,辅助制定策略。
- 教育者与学习者:教育者使用AI工具进行教学,学习者通过这些工具提升学习效率,共同促进教育个性化。
- 服务提供商与客户:服务提供商通过AI模型提供定制服务,客户享受个性化体验,形成客户中心的服务生态。
- 研究者与政策制定者:研究者利用AI进行研究,政策制定者应用研究成果制定政策,推动科技与治理结合。
通过这些相互作用,可以形成一个互动性强、多方共赢的用户生态系统,推动AI大模型技术的创新和广泛应用。
在AI大模型产品的子产品和其他相关产品之间构建产品生态系统的可能性和关系,可以通过以下几个方面来展示:
关系类型 | 描述 | 例子 |
---|---|---|
互补性 | 不同产品针对不同场景提供补充功能,共同满足用户需求。 | 图像识别模型与自然语言处理模型结合,提供多模态交互体验。 |
集成性 | AI大模型作为核心组件,集成到各种应用中,形成以AI为核心的生态。 | 智能手机集成语音助手,提供智能搜索和个人助理功能。 |
扩展性 | 基于核心AI模型开发新功能或产品,不断扩展产品线。 | 企业软件集成AI分析模块,提供市场趋势预测和客户关系管理。 |
互操作性 | 产品之间通过标准化接口互操作,实现数据和功能的有效整合。 | 不同品牌的智能家居设备通过统一平台进行控制和管理。 |
数据共享与协同 | 在合规的前提下,产品间共享数据和模型训练成果,提升整体性能。 | 医疗AI产品共享病例数据,协同提高疾病诊断的准确率。 |
商业模式创新 | 探索新的商业模式,如将AI模型作为服务提供,创造新的收入渠道。 | 云服务商提供AI模型API,供开发者使用和集成到自己的应用中。 |
通过上述表格,我们可以看到AI大模型产品的子产品和其他相关产品之间存在着多种潜在的关系和互动方式,这些关系有助于构建一个更加丰富和动态的产品生态系统,为用户提供更加全面和高效的服务体验。
产品规划
添加插件功能
原因
添加插件功能为了满足更广泛群体的使用
NABCD模型分析
需求 (Need)
- 目标市场和用户识别:通过调研和反馈,确定用户在使用类似产品或服务时遇到的主要挑战。
- 核心问题解决:明确插件功能需解决的关键问题,以满足用户的期望和需求。
优势 (Advantage)
- 技术创新:强调Kimi插件功能的创新点,包括任何专利技术或独特的用户体验设计。
效益 (Benefit)
- 用户价值:清晰地向潜在用户传达使用Kimi插件功能所带来的具体效益,如效率提升、成本节约等。
- 业务目标支持:展示如何通过使用Kimi插件功能帮助用户实现业务目标和增长。
竞争 (Competition)
- 市场分析:分析直接和间接竞争对手的产品特性、市场策略和用户基础。
- 差异化策略:制定差异化和定位策略,以在市场中脱颖而出。
- 动态监控:持续监控竞争对手的动态,并准备相应的应对策略。
推广 (Diffusion)
- 营销计划:设计包含在线营销、内容创作、社交媒体互动在内的全面推广计划。
- 用户参与:通过各种渠道和活动提高Kimi插件功能的知名度,并吸引用户试用。
- 反馈循环:建立反馈机制,根据用户反馈不断优化推广策略和产品功能。
十六周规划
周期 | 项目经理 (PM) | 技术负责人 (Tech Lead) | 前端开发工程师 (Front-end Developer) | 后端开发工程师 (Back-end Developer) | 测试工程师 (QA Engineer) | UI/UX设计师 (UI/UX Designer) |
---|---|---|---|---|---|---|
1 | 组织启动会议,明确项目目标 | 确定技术栈和开发工具 | 讨论项目需求和预期成果 | 讨论项目需求和预期成果 | 讨论项目需求和预期成果 | 讨论项目需求和预期成果 |
2 | 完成项目计划文档 | 完成系统架构设计 | 完成初步的UI/UX设计稿 | 设计数据库模型和API接口 | 讨论测试策略 | 根据反馈优化设计 |
3-4 | 监控项目进度 | 搭建开发环境和基础架构 | 开始前端界面的开发 | 开发后端逻辑和API接口 | 准备测试环境 | 准备设计原型 |
5-8 | 确保按时完成阶段性目标 | 进行代码审查和架构优化 | 分模块进行详细开发 | 分模块进行详细开发 | 编写测试用例 | 完善UI/UX设计 |
9-12 | 组织定期回顾会议 | 根据测试反馈进行代码修复 | 根据测试反馈进行代码修复 | 根据测试反馈进行代码修复 | 执行测试用例,记录和跟踪缺陷 | 根据反馈优化设计 |
13-14 | 组织产品发布准备 | 负责系统集成和性能优化 | 进行系统集成测试 | 进行系统集成测试 | 进行压力测试 | 准备产品发布材料 |
15 | 收集用户反馈和使用数据 | 解决集成过程中的问题 | 根据用户反馈进行调整 | 根据用户反馈进行调整 | 根据用户反馈进行调整 | 根据用户反馈进行调整 |
16 | 组织产品发布会 | 完成最终的质量检查 | 完成最终的质量检查 | 完成最终的质量检查 | 准备后续支持和迭代计划 | 庆祝成功发布 |