软件评测作业

这个作业属于哪个课程福州大学2023软件工程
这个作业要求软件工程实践——软件评测作业
这个作业的目标软件工程有理论,有实践,更重要的是分析,思辨,总结。在课程中,同学们自己组织团队写一个软件发布,然后分析其中的得失,的确是学习软件工程的一个好方法。这样能根据切身体会来分析,很有价值,但也有可能“身在此山中,未能看清全局。而且,课程时间有限,我们也不能做很多具体的项目。因此,我们也需要从间接经验中学习,分析。别的项目的成败同样给我们很多启发。

第一部分 调研,评测

文心一言
一、体验
1、介绍软件

文心一言是百度研发的 人工智能大语言模型产品,能够通过上一句话,预测生成下一段话。 任何人都可以通过输入【指令】和文心一言进行对话互动、提出问题或要求,让文心一言高效地帮助人们获取信息、知识和灵感。

指令(prompt)其实就是文字,它可以是你向文心一言提的问题(如: 帮我解释一下什么是芯片 ),可以是你希望文心一言帮你完成的任务(如: 帮我写一首诗/画一幅画

2、使用软件

登录:

文心一言采用登录及注册模式,配合手机短信验证登录,方便新用户的第一次注册。

在这里插入图片描述
使用:

在这里插入图片描述

3、优缺点分析

优点:

1、创作效率显著提升;2、文本多样性和丰富性增强;3、可应用于多个领域,促进跨学科融合。尤其是在提升创作效率方面,文心一言通过学习大量文本数据,能够迅速产出质量相对稳定的文本,极大地缩短了文本创作时间。这一特性使其成为内容创造者的有力助手,尤其在新闻报道、文案创作等领域展示了显著的优势。

缺点:

1、创作内容缺乏深度和个性化;2、依赖大量数据训练可能导致偏见问题;3、过分依赖可能抑制创造力。在缺乏深度和个性化方面,尽管文心一言能高效生成文本,但其内容往往缺少人类作家的情感温度和深度洞察,这在一定程度上限制了其创作的吸引力和感染力。

4、采访其它用户

采访对象:软件工程专业学生

TA的需求:提供问答能力,解决一些小问题。

采访记录:

在这里插入图片描述

二、BUG
1、BUG危险程度描述
bug等级描述
一级系统无法运行,崩溃或严重资源不足,应用模块无法启动或者异常退出,主要功能模块无法使用。
二级影响系统功能或操作,主要功能存在严重缺陷,但不会影响到系统稳定性。
三级界面、性能缺陷。
四级易用性及建议性问题
2、BUG汇总
1、侧边导航点击会有偏差

(1)测试环境:Window10,联想浏览器 9.0.3.1311版本

(2)bug的可复现性:bug是必然发生的,如下图所示,位置在鼠标所指位置点击时(在对话和百宝箱中间的空白处点击也是如此),不会跳至百宝箱,而是停留在对话界面。
在这里插入图片描述
(3)bug分析:
bug危险程度:四级

这个bug不会影响到功能的使用,属于易用性方面的bug。

主要是两个导航之间的分隔不明显导致的,如果鼠标移动距离过短的话就比较容易触发这个bug。

bug的改进可以设置一些比较清楚的分隔标志,更好的引导用户

2、性能测试

文字,代码测试暂时没有测试出问题,下面主要针对图片生成

(1)测试环境:Window10,联想浏览器 9.0.3.1311版本

(2)bug的可复现性:bug是必然存在的,如下图所示,对于图片生成还是不太准确的

在这里插入图片描述
再次测试后结果依旧:
在这里插入图片描述
(3)bug分析:

​ bug危险程度:三级

​ 这个是模型训练程度还不够,生成的图片还不够准确,对于关键字的提炼还不够准备,需要后续继续训练

三、结论

评价:好,不错!

1、提供了快捷的登录方式,采用登录及注册的模式,用户可以快速注册自己的账号进行使用

2、提供了使用指南,给用户提供了操作教程,给用户提供了完整的使用方式

3、操作界面简洁明了,首页即为主要功能AI问答的聊天框,新用户能很快上手进行使用,降低了使用难度。

4、文心一言在文章总结,代码编写,代码分析等功能方面表现良好,可以为我们平时的学习工作提供很多帮助,如整理文档,总结文章,进行简单代码编写修改等等

5、在体验方面,没有广告弹窗干扰用户的使用,体验起来很舒服

讯飞星火
一、体验
1、介绍软件

讯飞星火认知大模型是科大讯飞发布的大模型。该模型具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互 。

2、使用软件

登录:

讯飞星火采用登录及注册模式,配合手机短信验证登录,方便新用户的第一次注册。
在这里插入图片描述
使用:

在这里插入图片描述

3、优缺点分析

优点:

1、它具有强大的通用语言表示能力,可以作为多种下游任务的基础,包括机器翻译,文本摘要,情感分析,对话生成等。它在多个公开数据集上都取得了优于人类水平或接近人类水平的性能。
2、它具有丰富的中文知识库,可以理解和回答各种中文问题,包括常识,事实,逻辑等。它在中文问答数据集上都取得了显著优于其他模型的性能。
3、它具有灵活的生成能力,可以根据用户的需求和偏好生成各种类型和风格的中文文本,包括新闻,小说,诗歌,歌词等。它在中文生成数据集上都取得了高于其他模型的评分。
4、它具有开放的平台和接口,可以方便地与其他应用和服务进行集成和调用。它提供了多种形式的交互方式,包括网页端,移动端,语音端等。它还提供了多种形式的展示方式,包括图像,视频,音频等。

缺点:

1、对于一些新颖或幽默的问题,可能无法给出合理或有趣的回答

2、对于一些事实类的问题,可能出现错误或混淆的情况

3、对于一些史实或传统典籍,可能出现编造或歪曲的情况

4、对于多模态内容的生成,可能出现质量不高或不自然的情况

二、BUG
1、BUG危险程度描述
bug等级描述
一级系统无法运行,崩溃或严重资源不足,应用模块无法启动或者异常退出,主要功能模块无法使用。
二级影响系统功能或操作,主要功能存在严重缺陷,但不会影响到系统稳定性。
三级界面、性能缺陷。
四级易用性及建议性问题
2、BUG汇总
1、性能测试

​ 测试方面为代码功能方面

​ (1)测试环境:Window10,联想浏览器 9.0.3.1311版本

​ (2)bug的可复现性:bug是必然存在的

​ 提供一个缺少某个头文文件的函数,代码如下:

//线程主体函数
void* thread_fun(void* data) {
	int res = 0;
	CHAT_INFO chat_info = { 0 };
	int i = 0;
	while (1) {
		//read函数默认是如果客户端没有发送数据,那么read函数会一直等待
		//read函数参数:acceptFD:和客户端通讯的套接字
		//resbuf:服务器接受数据后存放位置
		//sizeof(resbuf):想接受的字节数
		res = read(acceptFD, &chat_info, sizeof(CHAT_INFO));
		if (res == 0) {
			cout << "client close" << endl;
			break;
		}
		//保存用户id到容器当中
		for (i = 0; i < client_vector.size(); i++) 
		{
			if (client_vector[i]->acceptFD == acceptFD) {
				client_vector[i]->user_id = chat_info.user_id;
			}
		}
		//遍历vector,然后把收到的内容通过向量里面的acceptFD进行发送
		for (i = 0; i < client_vector.size(); i++) {
			if (client_vector[i]->acceptFD > 0) {
				res = write(client_vector[i]->acceptFD, &chat_info, sizeof(CHAT_INFO));
			}
		}

		//cout << "server recv user_id: " << chat_info.user_id << endl;
		//cout << "server recv client_name:" << chat_info.name << endl;
		//cout << "server recv client_message:" << chat_info.message << endl;
		//收到数据,原样发还给客户端
		//回显数据

		memset(&chat_info, 0, sizeof(CHAT_INFO));
	}
}

只提供了函数模块,让他分析缺少的头文件会有哪些,以下是两次回答:
在这里插入图片描述
在这里插入图片描述
第一次回答缺少这个头文件,第二次回答无法确定哪个头文件,如果要确定究竟缺少哪个文件,需要进一步的询问。对比文言一心,文言一心可以直接给出分析,如下图:
在这里插入图片描述
​ 上述程序真正报错原因是read函数缺失,改变提问方式为:以上程序read函数报错,是缺少哪个头文件,它的回答如下:
在这里插入图片描述
而正确情况应该是存在于#include <unistd.h>头文件中的,综上所述,科大讯飞在代码功能这一方面还有待加强。

(3)bug分析:
​bug危险程度:三级

在对比了市面上其它同类产品后,科大讯飞的代码能力确实较弱,需要较清楚的指引才可以给出答案,这一部分的内容还需要后期继续训练模型来加强。

2、修改密码不会重新登录

(1)测试环境:Window10,联想浏览器 9.0.3.1311版本

(2)bug的可复现性:bug是必然存在的

登录后:
在这里插入图片描述
修改密码:
在这里插入图片描述
修改完密码后,原界面保持不变,功能均可以正常使用,存在安全风险

(3)bug分析:
​bug危险程度:四级

讯飞星火在登录修改密码之后,没有强制让用户重新登录,用户需要手动刷新页面才会变为登陆页面,应该在修改完密码后直接跳转至登陆页面重新登录,或者在原有页面点击功能后跳转至登陆界面。

三、结论

评价:一般!

1、提供了快捷的登录方式,采用登录及注册的模式,用户可以快速注册自己的账号进行使用

2、提供了使用指南,给用户提供了操作教程,给用户提供了完整的使用方式

3、操作界面简洁明了,首页即为主要功能AI问答的聊天框,新用户能很快上手进行使用,降低了使用难度。

4、在代码功能方面较弱,需要比较清楚的指引才能生成答案,此外给出的答案也不完全正确,对于从事跟代码编写工作有关的人员的帮助较弱。

第二部分 分析

一、文心一言
  • 开发时间估计

    团队构成:

    1、人数为6人左右

    2、人员构成均为计算机大学毕业生

    3、有专业UI支持

    团队开发时间估计,一般需要考虑以下几个方面:

    1. 平台规模和复杂度:平台的规模和功能复杂度会直接影响开发时间。如果平台功能众多、交互复杂,开发周期自然会延长。
    2. 技术栈和工具选择:开发团队选择的技术栈和工具也会影响开发速度。采用成熟且高效的框架和工具可以缩短开发周期。
    3. 团队经验和技能:虽然团队成员都是计算机大学毕业生,但他们的实际经验和技能水平会有所不同。经验丰富的团队成员可以更快地解决问题,提高开发效率。
    4. 项目管理和沟通:有效的项目管理和团队成员之间的良好沟通可以确保开发过程顺利进行,减少因误解或沟通不畅导致的延误。
    5. 测试和调优:平台开发完成后,还需要进行充分的测试和调优,以确保平台的稳定性和性能。这也是一个耗时的过程。

    综上所述,个人认为需要4-8个月的时间进行开发,在开发之间,团队需要做好需求分析,划分好软件功能点,确定好角色分工以及使用的技术栈,如果团队有一定的开发经验,技能水平较高,那么开发速度会比较快,否则还需要加上新技术的学习时间,此外还有团队之间的磨合,如果团队之间交流没有做好,很有可能会推倒重来,这样软件的开发整体周期就变长了。

  • 同类产品对比排名

    与讯飞星火进行对比:

    对比讯飞星火,二者在页面交互方面都做得不错,用户都能快速上手使用。二者也都提供了模型介绍和使用教程,方便解决用户使用方面的一些问题。在功能方面,初步体验下来感觉文心一言略胜于讯飞星火,作为软件工程专业的一名学生,主要目的还是想使用这类软件来辅助代码编写,而文心一言在代码功能这方面能力比讯飞星火更强一点,对我的帮助更大。

    结论:

    对我的帮助:文心一言 > 讯飞星火

  • BUG存在的原因分析

    1、侧边导航栏偏差

    初步猜想为团队认为用户每次都会精准的点击到图标上,而不是在图标附近,因此组件的边界设置比较模糊,两个图标之间的空白较大。而当用户想使用下一个功能的时候,如果鼠标移动距离不够长,极有可能停留在这个空白区域内,从而被系统判定为依旧停留在当前页面,而不是进行跳转。

    2、性能方面

    文心一言的图片生成功能方面,这个功能目前来说还是比较简陋的,无法较好的提取到关键字,尤其是在识别谓词方面,例如生成一碗没有绿色豌豆的蛋炒饭,文心一言生成出来的图片为含有绿色豌豆的蛋炒饭,前面没有这个谓词就被忽略了,故在图片生成方面,文心一言大模型训练程度不够,仍需要进一步训练。

  • 软件工程方面的建议

    1. 用户体验优化:关注用户体验,不断优化界面和交互设计,确保用户能够方便、愉快地使用软件。
    2. 持续改进:不断收集用户反馈并持续改进功能,进一步完善图片生成功能。
二、讯飞星火
  • 开发时间估计

    团队构成:

    1、人数为6人左右

    2、人员构成均为计算机大学毕业生

    3、有专业UI支持

    团队开发时间考虑的方面与上面文言一心考虑的方面基本一致,讯飞星火的基本功能有:用户登录,ai问答,助手中心等,功能与文心一言类似,故个人认为也需要4-8个月的时间进行开发。

  • 同类产品对比排名

    与文心一言进行对比:

    对比讯飞星火,二者在页面交互方面都做得不错,用户都能快速上手使用。二者也都提供了模型介绍和使用教程,方便解决用户使用方面的一些问题。在功能方面,初步体验下来感觉文心一言略胜于讯飞星火,作为软件工程专业的一名学生,主要目的还是想使用这类软件来辅助代码编写,而文心一言在代码功能这方面能力比讯飞星火更强一点,讯飞星火的代码能力不强,回答是自己胡编乱造概率更高,答案更不稳定。除此之外,讯飞星火的修改密码不会强制跳转至登录页面,这一点是不安全的,用户账号隐私可能会被侵犯。

    结论:

    对我的帮助:文心一言 > 讯飞星火

  • 软件工程方面的建议
    1. 用户体验优化:关注用户体验,不断优化界面和交互设计,确保用户能够方便、愉快地使用软件。
    2. 持续改进:不断收集用户反馈并持续改进功能,主要是完善代码方面的功能,使其可以更好的辅助代码编写工作的人员。
  • BUG存在的原因分析

    1、修改密码不会重新登录

    讯飞星火在登录修改密码之后,没有强制让用户重新登录,功能也可以正常使用,用户需要手动刷新页面才会变为登陆页面,应该在修改完密码后使原来的token失效并直接跳转至登陆页面重新登录,或者在原有页面点击功能后跳转至登陆界面。

    2、性能方面

    讯飞星火的代码能力弱于文心一言等其他产品,胡编乱造答案概率更高,答案不稳定,会出现你否定一次答案,他修改一次,然后你再说第一次答案是正确的,他也会赞同你,这方面的训练还需继续,对于计算机相关专业的学生来说,代码辅助这部分的功能还是比较重要的。

第三部分 建议和规划

一、文心一言
1、产品规划
  • 功能设计:添加语音助手功能模块

    理由:

    1. 即时性:语音问答功能允许用户通过口头提问立即获得答案,无需手动输入文字或等待长时间的搜索。这种即时性使得获取信息变得更为迅速和高效,特别适用于那些需要快速响应的场景。

    2. 自然交互:语音问答功能模拟了人与人之间的自然对话方式,使得用户能够以更自然、更直观的方式与设备进行交互。这种交互方式不仅降低了使用门槛,还提高了用户体验的舒适度。

    3. 解放双手:在某些场景下,用户可能无法或不方便使用双手进行操作,如驾车、烹饪或进行其他需要双手参与的活动。此时,语音问答功能就显得尤为重要,它允许用户在不中断当前活动的情况下获取所需信息。

    4. 个性化服务:语音问答功能通常与智能算法相结合,能够根据用户的提问习惯和兴趣提供个性化的答案。这种个性化服务有助于提升用户体验,同时也有助于建立更加紧密的用户关系。

    5. 跨平台应用:语音问答功能可以广泛应用于各种设备和平台,如智能手机、智能家居、车载系统等。这种跨平台应用使得用户无论身处何地,都能通过语音问答功能获取所需信息,实现无缝的信息交互。

  • NABCD分析

    N(Need)需求

    随着人工智能和物联网技术的快速发展,人们对于更便捷、更自然的交互方式的需求日益增长。语音问答功能能够满足用户在多种场景下快速获取信息的需求,尤其在驾驶、烹饪、运动等双手不便操作设备的情况下,语音问答显得尤为重要。因此,文心一言增加语音问答功能,是对用户需求的精准回应。

    A(Approach)方法

    通过采用先进的语音识别和自然语言处理技术,实现了语音问答功能。用户只需通过口头提问,系统便能准确识别并解析问题,进而给出相应的答案。这种方法不仅提高了交互的便捷性,还使得用户能够更自然地与系统进行交流。

    B(Benefit)好处

    1. 提升用户体验:语音问答功能使得用户能够更快速地获取信息,无需手动输入文字,从而提高了用户体验。
    2. 解放双手:在特定场景下,如驾驶或烹饪时,用户可以通过语音问答功能获取所需信息,无需分心操作设备,提高了安全性。
    3. 个性化服务:结合智能算法,语音问答功能还能够根据用户的习惯和偏好提供个性化的服务,进一步提升了用户的满意度。

    C(Competitors)竞争

    在智能语音助手市场,将面临着来自其他大型科技公司的竞争。这些竞争对手也拥有强大的语音识别和自然语言处理技术,并已经推出了类似的语音问答功能。因此,我们需要在技术和服务上不断创新和优化,以在竞争中脱颖而出。

    D(Delivery)实施

    用户可以通过移动设备、智能家居设备等多种终端使用这一功能。同时,文心一言还提供了详细的使用说明和客服支持,确保用户能够顺利地使用语音问答功能。

2、人员配置
  • ​ 开发人员(3人):负责功能开发,代码集成及优化
  • ​ 测试人员(1人):负责功能测试
  • ​ 美工(1人):负责界面UI设计
  • ​ 产品经理(1人):负责需求设计,市场调研,时间规划
3、详细规划
周期任务
1需求调研,收集并分析用户需求,明确语音问答功能的详细要求。 组建项目团队,分配角色与职责。
2设计系统架构,包括前后端交互、数据存储与处理流程。 制定技术实施方案与详细开发计划
3-4开发语音识别模块,实现语音输入的准确识别。 开发自然语言处理模块,解析用户意图并生成回答。 集成前后端功能,进行初步的功能测试与性能评估。
5-6设计用户与语音问答功能的交互界面与流程。 根据用户反馈与测试结果,优化交互设计,提升用户体验。
7-8结合用户数据,开发个性化服务算法,实现精准回答与推荐。 对个性化服务进行测试与调优,确保其准确性与有效性。
9-10将语音问答功能集成到文心一言平台中,实现与其他功能的无缝对接。 进行系统联调,确保各模块之间的协同工作。
11-12对系统进行性能优化,提升响应速度与处理能力。 进行压力测试,确保系统在高并发场景下的稳定性与可靠性。
13-14邀请部分用户进行实际使用测试,收集反馈与建议。 根据用户反馈,对系统进行针对性的优化与改进。
15-16对项目进行总结,梳理经验教训与改进措施。 制定上线计划,确保语音问答功能的顺利发布与推广。
二、讯飞星火
1、产品规划
  • 功能设计:添加视频文字提取功能

    理由:

    1. 内容快速获取:视频文字提取功能可以迅速将视频中的对话、字幕或标签等内容转化为文本形式。这使得用户无需观看整个视频,就能快速获取视频中的关键信息,大大提高了信息获取的效率。
    2. 便于搜索与整理:提取出的文字内容可以轻松地被搜索引擎索引,从而方便用户通过关键词搜索找到相关视频。此外,提取的文字也可以被用于整理视频内容,形成文档或摘要,方便用户后续查阅和引用。
    3. 跨语言理解:对于非母语视频或含有多种语言的视频,文字提取功能可以帮助用户突破语言障碍,通过翻译软件将提取的文字转换为熟悉的语言,从而理解视频内容。
    4. 辅助视频编辑:在视频编辑过程中,文字提取功能可以帮助编辑人员快速定位到视频中的特定台词或段落,方便进行剪辑、拼接或添加字幕等操作。这大大提高了视频编辑的效率和准确性。
  • NABCD分析

    N(Need)需求

    在数字化时代,视频内容越来越丰富,但如何从海量视频中快速获取所需信息却成为一大挑战。视频文字提取功能应运而生,满足了用户快速提取视频中的文字信息的需求,尤其是在需要记录、搜索、编辑或翻译视频内容时。

    A(Approach)方法

    视频文字提取功能通常通过先进的图像处理和自然语言处理技术实现。这些方法能够准确识别视频中的文字,并将其转换为可编辑的文本格式。同时,一些工具还支持多语言识别和格式转换,以满足不同用户的需求。

    B(Benefit)好处

    1. 提高效率:用户无需手动记录或转录视频内容,大大节省了时间。
    2. 方便编辑:提取出的文字可以直接用于编辑、排版或翻译,提升了内容制作的灵活性。
    3. 便于搜索:文本形式的视频内容更容易被搜索引擎索引,提高了视频内容的可发现性。
    4. 跨平台应用:视频文字提取功能可以应用于教育、媒体、娱乐等多个领域,促进信息的高效传播。

    C(Competitors)竞争

    在视频文字提取领域,存在众多竞争对手。这些竞争对手提供了各具特色的产品,如专业的视频编辑软件、在线转换工具等。为了在竞争中脱颖而出,开发者需要不断创新,提升技术的准确性和效率,同时优化用户体验,提供便捷的操作界面和客户服务。

    D(Delivery)实施

    视频文字提取功能通常通过软件或在线服务的形式提供给用户。开发者需要确保软件的稳定性和兼容性,以便在不同设备和操作系统上顺畅运行。此外,提供详细的用户指南和客服支持也是必不可少的,以确保用户能够轻松上手并充分利用这一功能。

2、人员配置
  • ​ 开发人员(3人):负责功能开发,代码集成及优化
  • ​ 测试人员(1人):负责功能测试
  • ​ 美工(1人):负责界面UI设计
  • ​ 产品经理(1人):负责需求设计,市场调研,时间规划
3、详细规划
周期任务
1确定项目的目标、范围、关键里程碑以及预期成果。 进行市场调研,了解当前市场上类似功能的竞品情况。 收集和分析用户需求,明确视频文字提取功能的具体要求和使用场景。
2研究并选择合适的图像处理、自然语言处理等相关技术。 设计系统架构,包括前后端交互、数据处理流程等。 制定详细的技术实施方案和开发计划。
3-4开发视频解析模块,实现对视频帧的提取和处理。 实现基本的文字识别功能,将视频中的文字转换为文本。 进行初步的功能测试和性能评估。
5-6优化文字识别的准确性和效率,提高识别率。 扩展功能,支持多种语言和字符集的识别。 增加对视频字幕、标签等元数据的提取功能。
7-8设计用户友好的界面和操作流程。 实现视频上传、预览和提取结果的展示功能。 优化用户交互体验,提高易用性。
9-10将视频文字提取功能集成到现有的平台或应用中。 进行全面的系统测试,包括功能测试、性能测试和兼容性测试。 修复测试中发现的问题和缺陷。
11-12对系统进行性能优化,提高处理速度和效率。 增强系统的稳定性和可靠性,确保在高并发和大规模数据下的正常运行。
13-14邀请用户进行试用,收集反馈和建议。 根据用户反馈,对系统进行针对性的优化和改进。
15-16对项目进行总结,梳理经验教训和改进措施。 制定上线计划,确保视频文字提取功能的顺利发布和推广。
三、市场分析
1、市场概况

大语言模型市场目前正经历着快速增长的阶段。据MarketsandMarkets发布的报告,全球大型语言模型市场规模预计将从2024年的64亿美元激增到2030年的361亿美元,复合年增长率为33.2%。这一增长主要受到大型数据集的可用性不断提高、深度学习算法的进步、对增强人机通信的需求以及对自动化内容创建和管理的需求不断增长等因素的推动。

在中国,大型的通用语言模型正处于发展阶段,如百度和华为等公司正在追赶国际趋势,但在数据、算力和工程化实施方面仍面临挑战。此外,一些头部企业和百模家族的产品也在市场上爆发性增长,大型语言模型的应用场景正不断拓展,从通用产品向多个行业延伸。

从用户和市场角度看,大型语言模型的用户主要包括企业、研究机构和个人开发者,市场上的应用场景包括自动写作、聊天机器人、智能助手、内容推荐等。同时,随着技术的进步和硬件的发展,语言大模型的规模和性能将会不断提高,未来的语言大模型可能会具备更强大的语义理解和生成能力,能够更准确地模拟人类语言行为,进一步提升应用场景的质量和逼真度。

总的来说,大语言模型市场正处于快速发展阶段,具有广阔的市场前景和发展空间。然而,也需要注意到在数据、隐私、安全等方面的挑战和问题,以确保市场的健康和可持续发展。

2、市场现状

目前的大语言模型市场呈现出繁荣的景象,有多个知名的大语言模型。以下列举了一些主要的大语言模型:

  1. GPT系列
    • 优点:GPT系列,以其强大的语言生成能力和广泛的应用场景而著称。它能够在各种任务中展现出出色的性能,并且在对话生成、文本摘要、机器翻译等领域都有广泛应用。
    • 缺点:尽管GPT系列在生成文本方面表现出色,但在处理特定领域或专业知识时,可能还需要进一步的专业化训练。此外,由于其模型规模庞大,训练和推理成本也相对较高。
  2. BERT系列
    • 优点:BERT系列模型在自然语言理解任务上表现优秀,尤其在问答、情感分析和句子对分类等任务中取得了显著成果。它通过双向上下文编码,提高了对文本的理解能力。
    • 缺点:与GPT系列类似,BERT在处理特定领域知识时也可能存在不足。此外,BERT主要用于理解任务,而非生成任务,因此在某些应用场景中可能受到限制。
  3. T5模型
    • 优点:T5模型是一种多任务通用模型,能够适应多种不同的自然语言处理任务。这使得它在处理复杂任务时具有更大的灵活性。
    • 缺点:由于其多任务性质,T5模型可能需要在多个任务之间进行权衡,导致在某些特定任务上的性能可能不如专门为该任务设计的模型。
  4. ERNIE系列
    • 优点:ERNIE系列模型通过引入知识增强技术,提高了模型在语义理解和知识推理方面的能力。这使得它在处理需要深度理解的文本时表现出色。
    • 缺点:引入知识增强技术可能会增加模型的复杂性和训练成本。此外,对于某些特定领域或专业知识,可能还需要额外的数据和训练来优化模型性能。
  5. 其他模型:如Baidu PLATO、Alibaba PAi、Tencent ERNIE Bot等也都在大语言模型领域有着不俗的表现。这些模型各具特色,有的侧重于对话生成,有的则更擅长于文本理解或知识推理。
3、市场与产品生态
3.1、文心一言
1、市场

文心一言的市场与产品生态呈现出广阔且深入的发展态势。作为百度全新一代知识增强大语言模型,文心一言在市场中以其独特的优势占据了重要地位。

文心一言的市场定位明确,致力于通过自然语言理解(NLU)和自然语言生成(NLG)两大技术根基,强化机械与人类语言之间的流畅对话。这一技术定位使得文心一言在人工智能领域中脱颖而出,成为备受瞩目的新星。

文心一言的市场前景也备受关注。随着大模型进入建生态阶段,文心一言在云业务中的广泛应用和持续增长的用户调用量,为其带来了数十亿元人民币的增量收入预期。同时,文心一言在医疗、金融、教育等领域也有着广泛的应用前景,其技术可以帮助百度构建中文语言模型,提高搜索引擎的精准度和用户体验,进一步扩大百度的应用场景和市场份额。

2、产品生态

文心一言展示了强大的创新能力和应用场景拓展能力。其团队利用复杂算法不断优化产品性能,创新性地将NLU与NLG技术应用到客户关系管理、市场预测分析、舆情监控等多个商业环节,协助组织机构制定更为精准的战略决策。文心一言还发布了多个原生插件,如百度搜索、览卷文档、E言易图、说图解画和一镜流影等,扩展了大模型能力边界,更适应场景需要。这些插件的推出进一步丰富了文心一言的产品生态,为用户提供了更为全面和便捷的服务。

同时,文心一言也在积极寻求与合作伙伴的共生共荣。例如,方正电子等媒体机构成为文心一言的首批生态合作伙伴,利用百度智能对话技术成果,打造内容生态人工智能全系产品及服务。这种合作模式不仅有助于推动文心一言在媒体行业的深度应用,也为合作伙伴带来了创新的技术支持和商业机会。

3.1、讯飞星火
1、市场

首先,讯飞星火认知大模型作为科大讯飞的重要创新产品,自发布以来就受到了市场的广泛关注。这款大模型不仅为科大讯飞的经营提供了强大的支持,还推动了公司C端硬件的GMV创下历史新高,同比增长翻倍。特别是在学习机领域,星火大模型的加持使得学习机GMV实现了显著增长。

此外,科大讯飞还通过举办全球开发者节等活动,进一步推动人工智能产业的发展。这些活动不仅为开发者提供了交流和学习的平台,还促进了科大讯飞与全球合作伙伴的深入合作。

2、产品生态

其次,讯飞星火在多个领域都有广泛的应用。在医疗领域,它展现出了卓越的应用能力,可以帮助医生进行疾病诊断和治疗方案制定。此外,科大讯飞还推出了星火乐学、星火康养、星火语音助手等多款针对不同应用场景的产品,进一步丰富了其产品生态。

随着大模型的广泛应用,科大讯飞与所有生态伙伴共同推动通用人工智能产业生态的发展。讯飞星火认知大模型的开发接口已正式对外开放,支持多端接入快速集成,支持私有化部署,与广大开发者共建生态。

以上这标志着科大讯飞正在构建一个开放、合作、共赢的生态系统,以推动人工智能技术的创新和应用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值