▌ AI大模型的前世今生
1.大模型发展概述
人工智能早在1956年就已出现,后面在此基础上又出现了机器学习。在发展过程中,算法层面变得更为丰富。进一步发展,又出现了深度学习,引入了神经网络。基于深度学习,在2021年出现了预训练大模型。2023年ChatGPT的发布,引起了人们更多的关注和更广泛深入的探索。
2.什么是大模型
到底什么是大模型,大模型大在什么地方?首先,算法模型不一样,最早是transformer奠定了后续各类大模型的模型基础。其次是海量参数,以前的模型最多只有百万级参数,而现在的大模型常常是亿级、十亿级,甚至百亿级。第三是海量数据,预训练会用到很多的数据,比如ChatGPT完全是基于网上数据去进行预训练。
3.大模型很强大 , 但仍处于早期发展阶段
大模型能力很强大,真正比较深入的应用还不是很多,整体上还处于早期的阶段,因此在行业应用中会碰到各种问题。
1)成本高
如果去做一个垂类的大模型应用,首先考虑部署,私有或者共有。私有部署需要基础数据标注、训练成本、算力成本、预训练团队成本。在训练完成后,上线使用还会有推理成本。
2)垂类应用难
现在应用较多的还是通用大模型,通过文字输入一些问题,以知识库的形式去回答,一旦聚焦到解决具体行业问题时,经常难以满足一些垂类应用。比如AIGC做一些营销素材的生成,如果嫁接到汽车行业里面去解决一个具体的问题,还是比较难的,中间会需要很多的调整,以及预训练。
3)安全问题
大模型应用时,尤其是知识库,会涉及到各种各样的敏感问题,答案输出也需要考虑是否符合国家相关规范,因此大模型需要解决合规的一些问题。
4)隐私问题
与个人相关,包括法律法规规定的一些敏感数据,一定不能通过通用大模型去输出。
4.大模型催生“效率革命” , 为产业提质增效
经常会有人问,大模型能够创造什么价值?其价值的核心在于效率,为各个产业降本增效起到积极的作用。
1)能力比较强
大模型在专业领域,包括推理能力上比人强很多。
2)效率更“高”
AI大模型,以及衍生出的AI数字员工,能够代替一部分人工的工作,提高效率。
3)场景更“广”
AI大模型的应用场景广泛,比如汽车营、销、服、研、产、供等各个环节,包括智能驾驶、智能座舱等等,各个车企都已经开始实现大模型上车,在车上真正的去使用大模型。
4)应用更“深”
无论是行业级应用,还是具体产生直接价值的应用,大模型+AI将推动全链路的智能化。
▌ AI大模型在汽车营、销、服领域的探索
1.汽车营销 、 服业务全景图
在整个营、销、服阶段有很多环节都可以基于AI大模型去进行赋能。我们对这些环节逐一进行了探索和尝试,寻找可以真正落地的场景。
2.营销 : 提高内容产出效率 , 助力线索提升
1)舆情问题智能匹配
在舆情问题发生后,需要质量部门的人员进行识别和判断,再发到研发侧。可以通过AI大模型去做预判,把每天舆情的问题自动转换成一些匹配,分给对应的质量部门和研发部门。
2)媒介投放
投放广告的时候,需要写关键词,可以通过AI大模型去做拓词,拓展关键词把它放进去。还可以通过大模型去做标题和素材的生成,批量生成多个标题和对应的落地页素材。
3)AIGC智能生成内容
在车企营销部门会做专门的品牌素材,这些素材创作出来视频以后,需要到对应社交媒体平台去做矩阵式分发。可以通过AIGC基于这些素材进行二次创作,在分发给销售人员进行分发获取对应的线索。我们在汽车行业聚焦在小红书训练一个垂直大模型,进行销售内容的二次创作,在新车发布上市、品牌日等场景下做一些内容发布。还有一些赋能设计师的工作,辅助海报的设计、落地页的图文设计等。
3.销售 : 强化销售能力 , 赋能线索转化
1)AI销售助手
在销售线索跟进时,大模型能进行一些AI洞察,包含线索的一些属性、偏好以及对应的跟进话术策略。在AI销售助手里,将整个话术知识库挂载到大模型上进行训练。
2)AI销售培训对练
AI模拟销售和用户做真实场景的对练培训,可以检验介绍的点有没有到位,如产品功能介绍,以及对应话术有没有说,比如引导试驾。在AI的培训对练中,模拟过程也可能会拆成几步,如邀约跟进过程的话术,或者出单相关话术和遇到的问题。
3)AI外呼摘要
在AI外呼时,可以通过大模型做外呼摘要的处理,其实是对语音的数据处理,包括对方言的处理,还可以在销售环节中进行探索。
4)AI销售培训师
可以通过数字人的形式去做培训,批量培训销售人员。讲课时的数字人在语音上可以达到逼真的效果。
4.服务 : 洞察用户诉求 , 赋能个性化服务
1)客服知识库
AI大模型可以对客户提问做综合管理,客服人员无需自行探索,使用大模型提供的答案即可给出满意的回答。
2)AI售后诊断
在车联网数据平台上的智能诊断平台,其中有驾驶的数据、电池的数据、信号的数据等,根据对应的问题可以发现规则中没有的诊断问题。通过大模型,可以把诊断的这些规则形成一个专有知识库。
5.数据 : 变革取数模式 , 助力数据管理
1)AI取数(chatBI)
AI取数chatBI,替代了传统BI,目前还存在取数不准的问题。另外,还可以通过大模型的BI工具去做快速的看板搭建,还可以帮助写SQL。在未来,可以直接通过语音问答,即可获取到底层数据,改变看数据的场景和取数的交互方式。
2)AI口径管理
在指标管理平台里面,各个指标口径不一致,通过大模型的工具,可以解答指标的口径,同时能告知上下游指标间的关系。助力指标管理。
3)AI元数据管理
通过元数据管理平台,可以赋能上游业务系统去做表的建设,保持元数据的统一规范,同时赋能数仓的建模以及下游模型的搭建。
▌ 大模型的基建策略
1.碰到的难点
目前大模型建设中遇到的难点主要包括以下几方面:
1)大模型使用场景怎么设定
大模型的使用场景该如何去设定,比如前面讲到的最开始不是一上来就要做小红书这样的垂直大模型,而是要做一个AIGC,在后续交流过程中逐渐发现场景越来越聚焦,最终聚焦到小红书素材生成的场景。
2)基于场景的语料怎么准备和处理
每次大模型训练都可能会涉及到场景和语料,怎么准备怎么处理,并且在准备和处理时,不仅仅是技术人员,还有产品人员、业务人员都要共同参与。如AI销售培训场景中,进行了3-4轮的改进,耗时两个多月,每准备处理一次,都会想到一些新的处理点,在语料的处理上也不断发现了一些技巧。
3)大模型怎么训练(prompt和微调)
训练包括两种,一种是直接训练和做微调,需要有比较好的平台和算法团队;第二种是轻量级,用prompt做提示词先把场景做好,在需求验证的情况下,对prompt进行调试,在场景和需求固定以后再去做微调和算力调整。
4)大模型的成本怎么评估:训练成本和运行成本
大模型的训练成本,在调研时发现各个厂家大模型有很多是共有token的方式,还有的是私有化部署,需要卡和平台的资源。另外就是开源,开源的就是卡的资源。在成本上需要充分开绿,项目能不能持续的成本投入很重要,除了训练时的成本,在运行时成本更高。
5)大模型部署:共有VS私有
各个公司的部署方式不同,私有大模型平台成本是非常高的,至少千万级以上,启动这种项目不是小项目,需要业务价值能够承载。如果仅为探索,可以调用共有大模型API去进行尝试。如果有对应的算法团队,可以做一些开源模型的尝试,这样场景验证可以有比较好的冷启动。
6)大模型效果怎么评估
大模型的评估包括三个角度,第一个是精准度,第二个是拟人的角度,第三个是提问的关联角度。在大模型评估时,可能内容人员无法评估,可以借助外部进行,如供应商,评估内容不仅包括技术指标,还有业务指标。
7)是否安全合规
安全合规方面,有的同学可能会使用OpenAI等工具,这在合规上是不允许的,需要尽量避免。在大厂的模型里面,都具备一些能力针对安全合规的内容进行审核和过滤。
8)业务价值怎么衡量
在业务价值的衡量上有个策略是离钱近容错高,也就是离业务很近,如销售业务容错率比较高,不会因为回答不精准导致很大的问题,但如BI,回答错了影响则会非常严重。另一方面是覆盖范围,覆盖范围广,提效的影响就更大。
2.建设AI大模型能力的痛点
目前建设大模型主要痛点包括:技术变化快,人才短缺,初始投入大,缺少成熟的工具链,产业链分工尚未成熟,场景落地缺乏经验,以及应用效果难评估等。
3.如何构建AI大模型基础设施
构建AI大模型的基础设施,可以采用公有云实例的方式,如果有专有云实例的话,可以嫁接一些自己的向量数据库。如果数据不敏感,就用纯公有云的方式。另外就是私有部署,私有化的大模型是最贵的,基于通用的行业大模型,训练公司自己的垂直大模型,或者进一步训练各个业务场景的大模型,如营销的、销售的、售后的大模型等等。
▌ 未来的展望
1.大模型应用落地分为三个阶段 , 最终带来应用的爆发
1)人与AI协作
在2023-2024年,这个时候更多的是人和AI的协作,现在AI已经应用于内容生成、文字处理、图片设计等场景中。
2)部分自动化
这一阶段自动化可能会出错,在一些容错高的地方可以先行应用,比如广告的场景、培训的场景等等。
3)全自动化
在全自动化阶段,整个的训练决策,执行的动作,以及整个agent都将实现自动化。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓
👉AI大模型学习路线汇总👈
大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉大模型视频和PDF合集👈
观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓