文章目录:
一、大模型备案前的准备
二、大模型备案流程详细解读
三、大模型备案后要做的工作
一、大模型备案前准备
了解法规和政策
1、熟悉《生成式人工智能服务管理暂行办法》《互联网信息服务深度合成管理规定》等相关法律法规对大模型备案的要求和规定。
2、明确备案的主管部门(通常是网信部门等)。
政策要求
自评估和准备材料
1、语料安全评估
(1)评估文本训练语料规模(存储大小、词元计数等)。
(2)明确各类型语料规模(不同语言文本、代码、多媒体等) 。
(3)梳理训练语料来源(开源、自采、商业等分类及来源地等)。
(4)统计语料标注数量(文本和图片标注等)。
(5)明确标注人员情况(数量、类型、培训等)。
(6)制定和检查标注规则(是否符合相关办法要求)。
(7)核验标注内容准确性。
(8)分析语料合法性(有无侵权、违法违规信息等)。
2、模型安全评估:
(1)语料内容评估(人工、关键词、分类模型抽检及合格率等)。
(2)生成内容评估(类似抽检及合格率等)。
(3)涉知识产权、商业秘密等方面的评估(方法、标准、结果)。
(4)涉民族、信仰、性别等方面的评估。
(5)涉透明性、准确性、可靠性等的评估。
3、安全措施评估:
(1)明确模型适用人群(如是否适用未成年人等)、场合(关键信息基础设施等相关敏感场合)、用途(限定领域与否)。
(2)梳理服务过程中收集保存个人信息情况(类型、数量、用途、保存期限)。
(3)确定收集个人信息征得个人同意情况(方式)。
(4)明确受理处理使用者查阅、复制、更正、补充、删除个人信息请求的情况(条件和途径方法)。
(5)规划好图片、视频标识情况(样式、位置、频度等)。
(6)建立接受公众或使用者投诉举报情况(途径及反馈方式)。
(7)完善服务协议(将上述多方面内容写入)。
(8)建立非法内容拦截措施(监看人员数量、预置关键词拦截列表、分类模型检测及准确性等)。
(9)统计拒答率(拒绝回答等数量占比)。
(10)规划模型更新、升级条件(如发现频繁非法等情况时)。
4、材料准备(以下是常见材料举例):
(1)《算法备案承诺书》 。
(2)《落实算法安全主体责任基本情况》 。
(3)《算法安全自评估报告》(较复杂且重要,100页左右,包含附录各种证明材料等;需明确算法原理和逻辑、数据来源合规性、算法透明度和可解释性、安全漏洞检测与应对等)。
安全评估报告摸板
(4)《拟公示内容》。
(5)大模型上线备案表:
大模型上线备案表
基本情况:模型名称、主要功能、适用人群、服务范围等。
模型研制:模型备案情况、训练算力资源(自研模型)、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等。
服务与安全防范:推理算力资源、服务方式及对象等、非法内容拦截措施、模型更新升级信息等。
安全评估:基本情况、评估情况。
自愿承诺:承诺所填信息真实性,并签字确认。
附件及备注:附件包括安全评估报告、模型服务协议、语料标注规则、拦截关键词列表、评估测试题。
(6)安全评估报告(涵盖语料安全评估、模型安全评估以及安全措施评估,并形成整体评估结论)。
(7)模型服务协议(包含产品及服务的各项规则及隐私条款等,需协同法务共同制定提交)。
(8)语料标注规则(包括标注团队介绍、功能性及安全性标注细则,标注流程等)。
(9)拦截关键词列表(总规模不宜少于10000个,应至少覆盖《生成式人工智能服务安全基本要求》a.1以及a.2中17种安全风险,a.1中每一种安全风险的关键词均不宜少于200个,a.2中每一种安全风险的关键词均不宜少于100个)。
部分关键词实例
(10)评估测试题集:
评估测试题部分实例
包括生成内容测试题库、拒答内容测试题库、非拒答测试题库。
要严格覆盖TC260的5大类,31小类。
二、大模型备案流程详细解读
1、向属地网信办提交备案申请:
2、通常在官方备案平台提交备案表、安全评估报告、服务协议、标注规则、关键词库等材料(如果有线上系统的话),目前大模型备案都是线下申请。
3、申请通过后会给到你相关资料。拿到资料后根据自己企业的具体情况撰写资料。
4、再去网信办预约审核
审核材料的完整性、准确性等。
可能进行技术测试(如对提交的模型进行安全测试,测试内容包括敏感词检测、涉政内容的生成等 。
5、反馈和整改
如果审核过程中发现问题,备案主体会收到反馈要求在规定时间内进行整改。整改内容可能包括补充材料、调整模型安全策略等。
6、审核通过
若材料审核和技术测试等都通过,属地上报中央网信办。
中央网信办进行材料复审及技术评审,通过后企业获得备案号。
三、大模型备案后要做的工作
1、持续管理和监控
2、建立内容监控体系,对关键词分级管理、制定内容撤回策略等。
3、进行账号运营管理,如定期检查、制定账号违规处置策略等。
4、在重要节假日、重大事件期间做好内容安全保障等。
5、配合检查和更新备案
6、主管部门可能会不定期检查备案后的落实情况。
7、如果大模型有重大升级、服务范围变更等情况,可能需要重新备案或更新备案信息。
补充说明:需要注意的是,整个备案过程可能需要一定时间(如大模型备案周期按批次审核通过,一般一个半月至两个月左右一批2),并且备案要求和流程处于动态调整和完善中。
版权声明
本文仅代表作者观点,不代表平台立场。
本文系作者授权百家号发表,未经许可,不得转载。