一文读懂 AI 大模型备案:万字详解全流程要点

一、引言

在当今数字化时代,AI 大模型以其强大的智能处理能力,广泛应用于各个领域,从智能客服到图像生成,从医疗诊断辅助到金融风险预测,大模型正深刻改变着人们的生活和工作方式。然而,随着其影响力的不断扩大,规范管理成为必然需求。AI 大模型备案制度应运而生,这一制度对于保障数据安全、保护用户隐私、维护社会稳定和国家安全具有重要意义。它确保大模型在整个生命周期,从开发、训练到部署和应用,都严格遵循相关法律法规,构建起一个安全、可信的 AI 生态环境。本文将深入且全面地剖析 AI 大模型备案全流程,助力相关企业和开发者清晰了解并顺利完成备案工作。

二、AI 大模型备案的重要性

  1. 数据安全与隐私保护:大模型训练需要海量数据,这些数据中可能包含大量用户隐私信息。通过备案,能够对数据的收集、存储、使用和共享等环节进行严格监管,确保数据不被非法获取、滥用或泄露,有效保护用户隐私。
  2. 维护社会稳定与国家安全:具有舆论属性或社会动员能力的大模型,如果缺乏有效管理,可能传播有害信息,误导公众,对社会稳定和国家安全构成威胁。备案制度可以从源头上把控,防止此类风险发生。
  3. 促进 AI 行业健康发展:规范的备案流程有助于淘汰不合规的模型和企业,净化市场环境,激励企业在合法合规的框架内创新发展,推动整个 AI 行业健康、有序前行。

三、备案前的准备工作

  1. 确定备案类型
  • 大模型备案:若大模型利用生成式人工智能技术,向境内公众提供生成文本、图片、音频、视频等内容的服务,且具有舆论属性或社会动员能力,面向社会公众提供生成合成的自研大模型或微调大模型服务(to C),则需进行大模型备案。
  • 大模型登记:适用于具有舆论属性或社会动员能力、面向境内公众提供服务,通过 API 等技术调用第三方已备案大模型的生成能力来赋能的 AI 产品。
  • 算法备案:依据《互联网信息服务算法推荐管理规定》,生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类这 5 类算法需备案。此外,只要涉及深度合成技术服务(文本、图片、音频、视频、虚拟现实等)都需要进行算法备案,无论最终产品服务形态是网页、app、小程序 。

2.了解备案所需资料

  • 大模型上线备案表:需详细填写大模型的基本情况,如模型名称、主要功能、适用人群、服务范围等;模型研制过程,包括模型备案情况、训练算力资源(自研模型)、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等;服务内容、安全防范措施、安全评估结果及自愿承诺等信息。
  • 安全评估报告:应由专业机构或团队完成,全面评估大模型在语料处理、模型训练、服务提供等环节中的安全性。评估内容涵盖数据隐私保护、算法偏见识别与纠正、有害信息过滤机制、应急响应预案等。
  • 模型服务协议:明确服务范围、双方权利义务、数据使用与保护、违约责任等条款,需经法务团队仔细审阅,确保合法合规。
  • 语料标注规则:详细介绍标注团队的资质、标注细则、标注流程等,确保语料来源合法、标注过程规范、标注结果准确。
  • 拦截关键词列表:需覆盖政治、色情、暴力、谣言等多种安全风险,至少包含 10000 个关键词,并定期更新。
  • 评估测试题集:用于检验大模型在生成内容时的安全性能,包括生成内容测试题库、拒答内容测试题库、非拒答测试题库,应严格按照《生成式人工智能服务安全基本要求》编制。
  • 与属地网信办沟通:主动与属地网信办取得联系,填写信息采集表,了解当地备案的具体要求和流程,获取备案所需的相关资料模板和指导文件。

四、算法备案流程

  1. 主体信息填报:平台前往官方备案网站https://beian.cac.gov.cn完成账号注册,然后进行主体信息填报。填报完成后,等待后台工作人员审核通过,方可进入下一步。
  2. 算法信息填报:准备好《算法安全自评估报告》、拟公示内容和算法详细属性报告。拟公示内容需体现算法透明度,具体功能和逻辑;属性包括基础属性和包括数据、模型、策略、风险防范机制在内的详细属性。通常会在 30 个工作日内得到答复。
  3. 产品及功能信息填报:关联产品及功能信息或填报技术服务方式,这一步需与算法信息填报一并递交审核。算法备案获得备案号相当于开车上路前取得驾照,整个过程大概需要 2 - 4 个月不等的时间。

五、大模型上线备案流程

  1. 报请属地网信办,获取备案表:企业向所在地的省级或市级网信办提交备案申请,获取大模型上线备案表,确保申请材料完整、准确。
  2. 根据表格和评估要点准备材料:按照备案表要求及评估要点,组织技术团队、法务团队、数据团队等多部门协作,准备相关材料,确保材料真实、全面。
  3. 企业内部评估,编写材料,准备测试账号:企业内部开展自评估,确保大模型在技术、安全、合规等方面符合要求。同时,编写详细的材料说明,准备测试账号(一般包括 10 个附加安全审核账号、10 个裸奔账号)及测试文档,以便审核人员验证模型实际运行情况。
  4. 提交材料和测试账号给属地网信办审核:将准备好的材料和测试账号提交给属地网信办审核,审核期间保持沟通畅通,及时回应审核人员的问题和反馈。
  5. 审核通过,上报中央网信办;未通过,根据反馈调整:属地网信办审核通过后,将备案材料上报至中央网信办进行复审;若审核未通过,企业需根据反馈意见进行调整,并重新提交材料。
  6. 中央网信办复审,通过下发备案号;未通过,重新备案:中央网信办对上报材料进行复审,通过后下发备案号,标志备案成功;若未通过,需根据反馈意见再次调整,并重新提交备案申请。

六、备案过程中的注意事项

  1. 时间周期:大模型的备案和登记整个过程因涉及资料准备、测试等众多环节,大约需要 3 - 4 个月左右的时间,算法备案时间周期大概为 2 个来月,企业需提前规划,避免延误。
  2. 境外模型风险:使用境外基座模型,或者爬取境外门户网站数据的企业,在裸奔测试中可能难以通过,因为境外模型和数据可能存在安全风险、不符合国内监管要求等问题,需格外谨慎。
  3. 特定行业限制:医疗健康、金融及企查查类型企业,目前暂时无法办理大模型备案,但可办理大模型登记手续,以满足业务需求并符合监管政策。
  4. 材料真实性:在填报材料时,务必确保所提供信息真实、全面,不遗漏任何重要细节或信息,否则可能导致备案失败。
  5. 评估报告详尽性:撰写评估报告时,要详尽描述各项评估内容,并形成明确结论,有助于审核人员更好了解大模型的安全性和合规性。
  6. 测试题集标准:准备测试题集时,要确保其满足《生成式人工智能服务安全基本要求》的相关标准,提高测试题集质量,增加审核通过的可能性。

七、备案后的管理

  1. 悬挂备案号:通过备案或登记后,企业需在显眼位置悬挂备案号,这既是合规标志,也是对公众的透明展示。
  2. 配合常态化安全测试:每月会进行常态化安全测试,企业要积极配合,确保大模型服务始终处于安全、合规的运行状态。一旦发现问题,及时整改,以持续满足监管要求。

八、结语

AI 大模型备案全流程是一个系统且严谨的过程,虽然繁琐,但对于企业和整个 AI 行业的长远发展至关重要。企业和开发者需认真对待每一个环节,严格按照要求准备资料、完成备案流程。在备案过程中,不断提升自身技术水平和合规意识,以适应日益完善的监管环境。相信随着备案制度的有效实施,AI 大模型将在安全、合规的轨道上释放更大的价值,为社会发展做出更多积极贡献。未来,随着技术的不断进步和监管政策的持续优化,AI 大模型备案流程也可能会有所调整和完善,相关企业和开发者需持续关注政策动态,及时调整备案策略和措施 。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值