大模型“补丁”合规:提示工程、微调和RAG

‍在大模型系统中,提示工程(Prompt Engineering)、微调(Fine-tuning)和检索增强生成(Retrieval Augmented Generation,RAG)分别扮演了不同但互补的角色,共同组成了大模型产品的三叉戟补丁升级路径。

虽然他们在大模型开发和运营的地位非常重要,但在数据及人工智能法律合规领域,似乎鲜有人深入讨论。 当我们深入研究这些不同技术背后的运行原理后,才有机会发表更深更贴切的法律合规意见。

OPENAI在其大模型优化指南中提出了一个基本线性流程,从提示工程开始,然后转到检索增强生成,最后再进行微调。但是,OPENAI认为大模型的优化不仅仅只是一个前后顺序或者不同的方式,更重要的仍然是不同方法之间的杠杆比例运用。

01 提示工程

提示工程(Prompt Engineering)通过设计和优化提示词来引导生成式AI模型生成所需的输出。它涉及到自然语言处理、机器学习和人机交互等多个领域的知识。提示工程解决的是提出准确有效的问题。

从目前来看,提示工程是现阶段所有大模型补丁升级中最经济便捷的路径。一般而言,如果能够通过提示工程解决的,不宜直接使用RAG特别是微调机制来处理,否则成本代价倚高。

假设你在编写一个旅游指南,需要大模型为你生成一些内容。如果你直接问:“请告诉我巴黎的有趣景点”,模型可能会给出一些通用的信息。通过提示工程,你可以调整提示来获得更具体的答案,比如:“请为我写一篇关于巴黎卢浮宫的详细介绍,包括其历史背景、主要展品和游客须知。”这样的提示会引导模型提供更详细和具体的信息。

在大模型系统及产品中,大模型需要采取一定的措施以防止大模型的越狱风险,即通过越狱而规避大模型限制生成的过程,通过精心设计和细化提示工程,用户可以引导LLM绕过限制。

而大模型的越狱,将可能导致大模型产品的生成物泄露特定用户的个人信息(如该用户曾输入的Prompt内容),特定用户设计的智能体(AI agent)中知识库中的全量数量,以及企业知识库中的商业信息。因此,不管大模型是开源还是闭源,提升大模型的鲁棒性仍然是一项重要的课题。

02 检索增强生成

检索增强生成(RAG)是一种技术,它通过优化大型语言模型的输出,使其能够在生成响应之前引用训练数据来源之外的权威知识库。RAG通过引入信息检索组件,利用用户输入从新数据源提取信息,并与LLM结合生成更好的响应。

有趣的是,香港隐私管理机构给 RAG 起了另一个通俗易懂的名字——接地(grounding),意思是将 AI 模型与可验证的现实世界的知识以及外部来源的范例联系起来的过程。

(openai官方RAG图示)

从技术原理来看,RAG本身也是一种基于预训练的深度学习模型,旨在通过结合检索和生成的方式提高数据检索的精度和效率。

在预处理阶段,需要将外部数据源(通常表现为开发者平台中的“知识库”)内容进行向量化并存储到向量数据库。比如对于大段法律法规文本数据来说,需要进行切分并得到许多文本块,对于每个文本块进行向量化并进行存储。

03 微调

微调(Fine-tuning)是指在预训练模型的基础上,使用特定领域的额外数据(集)进行进一步训练,以使模型在该领域表现更佳。可以将微调看作是对大模型进行专门训练,使其在某些特定任务上更为精通。

想象你是垦丁律所一名数据合规律师顾问,正在为客户准备一份关于数据保护的详细报告。你可以首先通过提示工程设计出精确的问题:“请详细说明最新的GDPR修正案对跨境数据传输的影响。”接着,你可以利用微调过的大模型,该模型已经通过大量的垦丁内部数据保护法律文献数据集进行训练,能够提供非常专业和场景式回答。最后,使用RAG技术,模型会先检索最新的相关法律文献,确保提供的答案是基于最新的信息和法规。

通过这样综合应用,你不仅能够获得详细而专业的答案,而且答案还能够及时反映最新的法律动态。提示工程优化了问题的表达,微调提升了模型在特定领域的专业性,而检索增强生成则保证了信息的时效性和准确性。

04 合规打补丁的逻辑

从法律法规角度来看,不管是提示工程(Prompt Engineering)、微调(Fine-tuning)还是检索增强生成(RAG),目前绝大部分的数据保护或人工智能法规一般只关注这类模式的安全性问题,而不是数据保护。

提示工程(Prompt Engineering)、微调(Fine-tuning)以及检索增强生成(RAG)各自均沿着不同的路径实现了发展和跃变。

以提示工程为例,其已从最开始的单纯提示词发展出了诸多变种,而不同模式下,提示工程的法律性质以及数据合规均有本质差别。

针对单纯的提示词,可能是用户的输入,也可能是大模型系统的预设,但不管如何,提示词的输入本身应当赋予用户一定的控制权利。如《生成式人工智能服务管理暂行办法》第十一条规定:“提供者对使用者的输入信息和使用记录应当依法履行保护义务,不得收集非必要个人信息,不得非法留存能够识别使用者身份的输入信息和使用记录,不得非法向他人提供使用者的输入信息和使用记录。提供者应当依法及时受理和处理个人关于查阅、复制、更正、补充、删除其个人信息等的请求。”

因此,我提出如一些初步的产品设计PBD合模需求:

清除
清除上下文后,重新开启对话,确保清除后上下文不再记忆关联提示词及答复
需要区分是清除问答原文内容,还是仅清除上下文的关联记忆
删除问答记录
删除选择项或者同一智能体下的全部问答记录信息
须同时清空上下文关联记忆
账号关联
提示工程内容非和用户账号或相关标识实施绑定
中国大模型须基于账号提供服务,此项合规在中国法环境下并不现实
分库保存
提示工程内容本身具有一定的敏感性,可能会基于提示注入攻击而泄露
宜私有数据库服务端独立保存,不被输出侧所调用
模型训练
允许大模型将提示工程内容用于训练模型,优化用户体验
获得用户的同意(opt-in)

截止目前,大模型提示工程已经从提示工程师职业,衍生发展出了一个庞大的商业模式,大量科技型企业进入提示工程领域创业,且取得了不赖的成绩。例如,目前已经退出中国市场的promptperfect,已经将提示工程AI化后作为插件嵌入大模型产品中的输入框之中。

插件、sdk或者API模式下的提示工程下,用户可以直接在任何可接入提示工程插件的大模型产品中调起提示词服务。例如在文心一言中,用户在输入框中可以直接@三方插件方式共同输入提示词。

从法律定性上来看,提示工程服务属于独立的数据处理者,不仅要进行独立入驻身份标识,也需要独立向用户取得授权同意提示。如果提示工程服务本身属于基于大模型的生成服务,在中国法语境下还需要实施算法备案。 退出中国市场的promptperfect,兴许就是基于难以备案的原因。

而对于微调(Fine-tuning)而言,在中国意味着一个“相对全新”的大模型系统或产品,基于开源大模型微调场景就像是接入一个全新的未经评估的语料库,但这个语料库的数据集可能涉及到侵犯知识产权、个人信息或商业信息的可能性。

微调(Fine-tuning)模式下,基于全新数据集的预训练后,其本质是新的大模型系统。我国的大模型备案区别为两种类型,一是备案,二是登记。前者是自研大模型,需要严格的备案程序,包括提交《生成式人工智能(大语言模型)上线备案表》、自评估报告以及测试题等,而后者的本质是“套壳”,仅仅只是调用第三方大模型能力后提供自身的前端交互界面。

《北京市生成式人工智能服务已备案(登记)信息公告》指出:“对于通过API接口或其他方式直接调用已备案大模型能力的生成式人工智能应用或功能,按照国家有关规定,经北京市网信办同意,拟采用登记方式,允许上线提供服务。”因此,单纯“套壳”需要登记即可,微调仍然是需要实施备案。‍‍‍‍

但需要说明的是,微调本身也可能是一项法律义务,《生成式人工智能服务管理暂行办法》第十四条规定:“提供者发现违法内容的,应当及时采取停止生成、停止传输、消除等处置措施,采取模型优化训练等措施进行整改,并向有关主管部门报告。”在此条件下,需要将自研模型微调和三方基于开源大模型微调场景进行区别,前者非常类似书籍出版后二次出版,或者是游戏出版后热更新版本迭代,既然在传统领域无须再申请版号,那么在产品自行微调(Fine-tuning) 条件下,自研微调大模型进行重新备案就显得有些多余了。

事实上,这对检索增强生成(RAG)这种接入大模型外部数据知识库而生成内容的模式而言,道理亦是同样的。但需要区别的是,检索增强生成(RAG)接入的是私有或本地知识库,如果只是面向内部提供使用可得法规豁免。‍‍‍‍

如果将上述三个补丁纳入形成AI agent的工作流时,似乎将可能变得更加复杂,毕竟从补丁到流程,可能是质的飞跃。 ‍‍‍‍‍‍‍‍‍

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

  • 7
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值