▼最近直播超级多,预约保你有收获
AIGC 作为顶尖的高材生,在你的企业落地了吗?
理想是丰满的,现实是骨感的。相信我们在落地过程中,拥有美好的期望,也有实际的填坑苦楚。这里给大家整理一份避坑指南。
—1—
大模型如何落地
相信我们在接触到大模型后,第一个头疼的问题是,这个世界太卷了,模型怎么选!
第一、基座模型选择困难
众所周知,大厂在模型上投入的人力物力是相当大的,虽然现在我们可以站在巨人肩膀上,接触到世界顶尖的模型和服务,但是怎么选择一个性价比高的,贴合企业实际场景的模型,依然是有挑战的。
许多企业还并没有深入试用过各家模型,更没有在自家企业内具体任务上对比过不同模型的效果。这个时候,不被而市面上模型的宣传所干扰,建立一个清晰、权威、客观的方式来选择模型,包括选择开源模型还是闭源模型,选择大型模型还是中型模型等,都是一个复杂的需要权衡的思考。
第二、缺乏高质量数据
当我们“绞尽脑汁” 选择了一个模型后,我们可以开心的进行大模型聊天机器人了。这个时候我们和企业外的团队站在了同一起跑线,怎么结合企业数据,追赶对手,肯定是我们一致目标。
这个时候对数据的治理,将是我们面临的又一个坑。
一般的,企业都缺乏高质量的知识库数据,大部分企业的结构化与非结构化数据治理还在起步或进行过程中。尤其是非结构化数据,散落在各个系统,既是重要的数据资产,也是技术同学的噩梦。
更深的,是缺乏应用场景相关数据,且不说场景优化的微调训练数据,连用于评测的真实数据也没有。而这部分数据由于大模型新事物的出现,大部分企业是没有任何沉淀的。比如:NL2SQL 场景,它的目标用户是技术小白,但以前都是专业人员做数据分析,并不存在小白用户通过自然语言方式表达的数据分析需求。
第三、效果难以评估
审核类场景往往与生成类场景相伴相生,所以各类“报告生成”场景都会有对应的审核场景。
当我们搞定数据后,总算不管是知识库 RAG 应用还是大模型微调,我们都能玩出花来了,那如何判断“花”是漂亮的花,又一遍遍刺痛着开发同学的心灵。
相较传统软件系统,以大模型为中心或者有大模型参与的系统,不确定性大大提升了,这个不确定性即是创作力,也是不可控因子。因为即使是相同的输入,大模型的输出也都是不固定的,这为评价系统效果带来了挑战。如何评估大模型应用?我们需要用哪些指标来评估,也是必须解决的问题。
第四、应用落地效果不及预期
当我们填完所有的坑,发现大模型应用落地效果依然不及预期,这个时候我们就抓狂了。
一方面大模型技术从原理上存在的天然缺陷导致它就是不可靠的,作为一个概率系统,大模型输出的结果不可控且不可解释,这对于大部分企业严肃业务场景来说是无法接受的。
另一方面,B端的应用场景要复杂得多,业务逻辑非常专业且复杂,这导致直接依靠大模型本身的能力或简单做个RAG根本无法解决问题。
到这里我们就要打开格局,回过头看,大模型应用能不能解决当前的问题了。毫无疑问,在未来模型能力不断加强的情况下,大部分当前遇到的困难都会被技术更新给填平。
—2—
填坑指南
不得不承认,大模型在企业内的应用落地仍处在早期阶段,当前的填坑也是非常早期的一些探索。将从认知重建、战略选择、灵活探索几个方面展开。
第一、认知重建
IT 一直以来都是 0/1 泾渭分明,做大模型应用很容易因为惯性思维走到传统机器学习经验上来,在各个环节过分关注准确率,当我们用传统的思路看,那我们就错过了大模型的优点。
大模型令人震惊的能力在于涌现、泛化、通识与通用推理。我们经常用“斯坦福大学生”来形容它。但它并不擅长把某个垂类任务做到极致——这是小模型的特长——即使通过训练大模型真的把某些垂类能力顶到极致,它整体的性价比也是差的,无论是训练的代价还是推理的代价。
大模型不是万能的,要有勇气承认失败。以发展的眼光看问题,对于一些大模型暂时解锁不了的场景,我们也不必硬上,可以过几个月等新一代模型发布后再进行验证。
第二、战略选择
未来是 AI 重塑时代,战略选择决定了我们选择自己站在哪个时代,是非常重要的前提。
只有当战略确定后,企业才能接受探索阶段的痛苦,才能将认知转化为生产力。企业都是各种利益组成的集体,放弃一些短期利益,去拥抱未来考验一个领导者的格局和战略定力。相信有老板支持的研发同学,更能发挥自己的主观能动性。
第七、灵活探索
筛选出一些成熟度较高且业务价值较大场景,可以开始进行必要的针对性优化,以达到真正的业务可用。注意,这里的优化并不一定是大模型,并且应当最后才去考虑动模型。
有两方面原因:
整个应用端到端效果受多方面因素影响,比如:数据治理情况、任务拆解与 Workflow 编排的情况、其他相关小模型的效果、大模型效果,从我们落地过程中做错例分析的经验来看,占比大的错误反而不在大模型,所以优化应当先从那些代价低、性价高的方向入手;
大模型本身能力的发展还在高速变化,很可能当下辛苦训练调优了一个模型,优化的能力几个月后就被新的基座模型给抹平了。
在场景严重的过程中,我们将收获新时代的开发模式、新的组织形态、新的人才结构,而这些都是企业的无形资产!
为了帮助同学们彻底掌握大模型的向量数据库、知识图谱、RAG 的应用开发、部署、生产化,今天我会开4场直播和同学们深度剖析,请同学们点击以下预约按钮免费预约。
—3—
!送!AI大模型开发直播课程
大模型的技术体系非常复杂,即使有了知识图谱和学习路线后,快速掌握并不容易,我们打造了大模型应用技术的系列直播课程,包括:通用大模型技术架构原理、大模型 Agent 应用开发、企业私有大模型开发、向量数据库、大模型应用治理、大模型应用行业落地案例等6项核心技能,帮助同学们快速掌握 AI 大模型的技能。
🔥即将开播
立即扫码,即可免费预约
进入直播,大佬直播在线答疑!
本期名额有限
高度起始于速度(手慢无!!)
—4—
!!再送!!《AI 大模型技术知识图谱》
最近很多同学在后台留言:“玄姐,AI 大模型技术的知识图谱有没?”、“AI 大模型技术有学习路线吗?”
我们倾心整理了 AI 大模型技术的知识图谱快来领取吧!
这份业界首创知识图谱和学习路线,今天免费送给大家一份!
只需要以下3步操作就可免费领取:
第一步:长按扫码以下我的视频号:玄姐谈AGI
第二步:扫码后,点击以下关注按钮,就可关注我。
第三步:点击"客服“按钮,回复“知识图谱”即可领取。
—5—
每日一大模型知识
END