生成式 AI 的发展方向,是 Chat 还是 Agent?
随着生成式AI技术的不断进步,关于其未来发展方向的讨论也愈发激烈。究竟生成式AI的未来是在对话系统(Chat)中展现智慧,还是在自主代理(Agent)中体现能力?今天我们做一下简单的探讨。
一、概念介绍
1.生成式AI在对话系统(Chat)
随着2020年,OpenAI推出了GPT-3模型,这一模型拥有前所未有的175亿参数,能够生成更加丰富、真实的文本,并被应用于智能写作、智能推荐、自动编程等领域。2023年,OpenAI推出了GPT-4模型,新推出图像和视频生成和文本摘要等功能,达到了前所未有的高度。
ChatGPT的技术原理基于大型语言模型(LLMs),通过学习庞大的在线文本数据库中的语言统计模式来工作。随着技术的发展,ChatGPT在未来的发展中必然会进一步提升自身的技术水平,例如提升检索结果的质量。技术提升的方式包括将海量数据,尤其是实时的新数据增加到原有的文本数据库中,对其中不实、偏见或过时的信息进行更正,并进行进一步的模型训练。此外,ChatGPT的未来发展还需要针对某些特定领域进行专业化的模型训练,以实现技术提升。随着技术的不断进步,ChatGPT将能够以更加丰富和细腻的方式与人类进行交流。
紧随ChatGPT的步伐,国内各大厂商也纷纷推出自己的大模型,文心一言、华为盘古、通义千问、KIMI、讯飞星火等,国内生成式AI近两年蓬勃发展,基于这些大模型,各家平台纷纷推出自己的C端应用APP和智能云大模型平台,抢占C端用户及B端的生态构建。AI 厂商提供基础设施,各行各业主动去探索应用场景,应用的场景非常多,这次世界人工智能大会(WAIC)也展示了非常多的应用,可以做下场景层的归纳:
- 客服领域:生成式AI对话系统能够替代部分一线人工客服,实现24小时在线服务。它能够快速响应用户咨询,提供准确的信息,有效减轻人工客服的工作压力,提升服务效率。
- 社交平台:生成式AI对话系统可以作为聊天机器人与用户进行互动。它不仅能够陪伴用户聊天、解答疑惑,还能提供娱乐内容,增加用户粘性。
- 教育领域:生成式AI对话系统可以为学生提供个性化的辅导。它能够根据学生的需求和进度,生成针对性的教学方案,提升学习效果。语言类的学习互动也非常方便,类似英语、国文等,效果也非常好。
-
医疗健康:AI对话系统在医疗健康领域的应用,主要面向医生、患者等人群,提供智能化的医疗咨询和辅助诊断服务。此外未来养老赛道,如果机器人的行动能力加上生成式AI的知识库和表达能力,居家机器人保姆的出现也是早晚的事。
-
商务办公:在商务办公领域,AI对话系统可以作为会议助手、日程安排工具等,帮助用户管理日常工作和会议安排,提高工作效率和准确性。office、wps系列的ai辅助优化,已经可以极大的提升效率,包括文案润色,PPT生成,excel表格的处理等等。
-
智能家居:AI对话系统在智能家居领域也有广泛应用。例如,通过智能家居系统,用户可以与AI对话系统互动,控制家中的灯光、空调、电视等设备,实现智能家居的自动化和智能化管理。这个其实已经有agent的身影了。
此外还有很多的应用场景,chat在toC领域可以作为知识搜索进行互动,也可以作为自媒体的辅助工具,对文案进行润色,或者提供写作大纲思路等,都是不错的选择,专业方向上,类似代码生成,代码质量检查,帮你写UT等。在toB,类似智能客服,数据分析报告生成等,已经可以帮助做非常多的事情。
随着生成式多模态的出现,生成式AI,已经不仅仅是chat的,可以让数字人说话,搞7*24小时直播,以后可能在直播间就不会有低血糖倒地的妹子了,在展馆进行数字人导航等。以后图片、动画的创作,由于AI的进步,对电商(图片生成,背景嵌套)及影视行业也会有很大的促进作用,未来动画片的创作成本,会由于AI的加持,而不断降低。
2.自主代理(AI Agent)
AI Agent是指一种利用人工智能技术来执行特定任务或解决特定问题的自主软件程序,俗称智能体。这些代理通过学习和模拟人类行为或特定领域的知识,能够在无需人为干预的情况下完成复杂的任务。以下是关于AI自助代理Agent的详细解析:
一、定义与特点
- 定义:AI自助代理是一种集成了感知、分析、决策和执行能力的智能体,能够根据用户的需求和环境的变化进行感知和决策,从而自主地执行任务,达到特定的目标。
- 特点:
- 感知性:AI智能体可以借助外部设备,例如摄像头、麦克风、温度计、GPS、激光雷达、超声波等外部设备,为大模型构建丰富多彩的环境信息画面,让智能体拥有“眼睛”和“耳朵”。
- 自主性:根据对环境的感知,智慧的做出决策,选择最优行动方案。
- 学习性:通过机器学习、深度学习等技术不断学习和改进,增强自己的推理能力。
- 适应性:能够适应不同环境和任务的变化,根据环境的变化,调整自己的参数或策略。
- 交互性:能够与其他代理或人类进行有效交流,而且具备长期记忆,积累知识,为未来的沟通和决策提供基础,是不断进步的原动力。
由于智能体有如上特征,智能体从感知、自主学习、进化、行动策略方面会越来越闭环,如果说chat是人工智能有推理和说的能力,那AI agent 则具备环境感知、思考、交互,甚至是行动的能力(例如调用某些接口,或者让设备本身运动起来,例如开关灯、空调,甚至是机器人开始行动,执行特定任务)。
结合特定的设备,例如人形机器人,机器狗、无人机等,设定特定的任务,则可应用的场景就会很多,具身机器人+大模型能力的整合,让设备具备智能与行动的能力,在工厂、紧急救援、医疗方面会有很多场景可以应用,日常生活、养老陪伴、机器伴侣等,可以根据主人的习惯进行不断学习,互动养成。甚至是军事领域的应用(想想都可怕,未来如果有大规模的战争,AI的应用是迟早的事情),都有非常广泛的用途。
但是具备智能与行动能力的机器人是比较危险的,如果不能限制他的能力,做好授权安全防护,破坏性会比较强,一些核心的能源,基础民生设施,交通等,如果给机器人权限, 都是非常危险的,应该让ai只做我们设定的任务,而不是让他们自主做各种可能的探索,这太危险了。
二、未来的发展趋势
结合上述的应用阐述,未来的发展趋势,个人认为应该是并行的,AI作为对话系统(Chat),会继续扮演知识专家的角色,给与我们提供各种帮助,提升知识劳动者的工作效率。甚至提供情绪价值,类似豆包APP,提供的定制化角色扮演能力,与我们进行互动。随着多模态的发展,在视频等领域,也会有进一步的发展,为媒体行业进行提效。
AI Agent,有其独特的价值,无人驾驶、(特定功能的)具身机器人,已经开始走入我们的生产生活,送餐机器人、酒店配送物资机器人、无人配送设备,都已经有初步的应用,后面养老护理机器人,在少子化、无子化、老龄化时代,肯定是刚需,会有很大的需求,不但可以做家务,还可以聊天唠嗑,陪老人下棋打发时间等,这些都应该是不远就会实现的事情。一些危险又繁重的体力劳动,类似挖矿等,机器人能干最好不过。
从应用场景来看, AI Agent未来的发展,更加令人兴奋,但是也更加危险,如何进行合理治理,甚至是社会伦理(AI agent犯法了,怎么判刑?判谁的刑呢,程序员、公司、买家、还是那个铁疙瘩?),发展公平,人类社会就业等一系列问题要解决,但是技术的发展,效率的提升,这个历史的车轮谁也无法阻挡,打不过,就拥抱他,发展人类特有的想象力和创造力,让AI为我所用。