一文读懂 AI 大模型备案：万字详解全流程要点

一、引言

在当今数字化时代，AI 大模型以其强大的智能处理能力，广泛应用于各个领域，从智能客服到图像生成，从医疗诊断辅助到金融风险预测，大模型正深刻改变着人们的生活和工作方式。然而，随着其影响力的不断扩大，规范管理成为必然需求。AI 大模型备案制度应运而生，这一制度对于保障数据安全、保护用户隐私、维护社会稳定和国家安全具有重要意义。它确保大模型在整个生命周期，从开发、训练到部署和应用，都严格遵循相关法律法规，构建起一个安全、可信的 AI 生态环境。本文将深入且全面地剖析 AI 大模型备案全流程，助力相关企业和开发者清晰了解并顺利完成备案工作。

二、AI 大模型备案的重要性

数据安全与隐私保护：大模型训练需要海量数据，这些数据中可能包含大量用户隐私信息。通过备案，能够对数据的收集、存储、使用和共享等环节进行严格监管，确保数据不被非法获取、滥用或泄露，有效保护用户隐私。
维护社会稳定与国家安全：具有舆论属性或社会动员能力的大模型，如果缺乏有效管理，可能传播有害信息，误导公众，对社会稳定和国家安全构成威胁。备案制度可以从源头上把控，防止此类风险发生。
促进 AI 行业健康发展：规范的备案流程有助于淘汰不合规的模型和企业，净化市场环境，激励企业在合法合规的框架内创新发展，推动整个 AI 行业健康、有序前行。

三、备案前的准备工作

确定备案类型：

大模型备案：若大模型利用生成式人工智能技术，向境内公众提供生成文本、图片、音频、视频等内容的服务，且具有舆论属性或社会动员能力，面向社会公众提供生成合成的自研大模型或微调大模型服务（to C），则需进行大模型备案。
大模型登记：适用于具有舆论属性或社会动员能力、面向境内公众提供服务，通过 API 等技术调用第三方已备案大模型的生成能力来赋能的 AI 产品。
算法备案：依据《互联网信息服务算法推荐管理规定》，生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类这 5 类算法需备案。此外，只要涉及深度合成技术服务（文本、图片、音频、视频、虚拟现实等）都需要进行算法备案，无论最终产品服务形态是网页、app、小程序。

2.了解备案所需资料：

大模型上线备案表：需详细填写大模型的基本情况，如模型名称、主要功能、适用人群、服务范围等；模型研制过程，包括模型备案情况、训练算力资源（自研模型）、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等；服务内容、安全防范措施、安全评估结果及自愿承诺等信息。
安全评估报告：应由专业机构或团队完成，全面评估大模型在语料处理、模型训练、服务提供等环节中的安全性。评估内容涵盖数据隐私保护、算法偏见识别与纠正、有害信息过滤机制、应急响应预案等。
模型服务协议：明确服务范围、双方权利义务、数据使用与保护、违约责任等条款，需经法务团队仔细审阅，确保合法合规。
语料标注规则：详细介绍标注团队的资质、标注细则、标注流程等，确保语料来源合法、标注过程规范、标注结果准确。
拦截关键词列表：需覆盖政治、色情、暴力、谣言等多种安全风险，至少包含 10000 个关键词，并定期更新。
评估测试题集：用于检验大模型在生成内容时的安全性能，包括生成内容测试题库、拒答内容测试题库、非拒答测试题库，应严格按照《生成式人工智能服务安全基本要求》编制。
与属地网信办沟通：主动与属地网信办取得联系，填写信息采集表，了解当地备案的具体要求和流程，获取备案所需的相关资料模板和指导文件。

四、算法备案流程

主体信息填报：平台前往官方备案网站https://beian.cac .gov .cn完成账号注册，然后进行主体信息填报。填报完成后，等待后台工作人员审核通过，方可进入下一步。
算法信息填报：准备好《算法安全自评估报告》、拟公示内容和算法详细属性报告。拟公示内容需体现算法透明度，具体功能和逻辑；属性包括基础属性和包括数据、模型、策略、风险防范机制在内的详细属性。通常会在 30 个工作日内得到答复。
产品及功能信息填报：关联产品及功能信息或填报技术服务方式，这一步需与算法信息填报一并递交审核。算法备案获得备案号相当于开车上路前取得驾照，整个过程大概需要 2 - 4 个月不等的时间。

五、大模型上线备案流程

报请属地网信办，获取备案表：企业向所在地的省级或市级网信办提交备案申请，获取大模型上线备案表，确保申请材料完整、准确。
根据表格和评估要点准备材料：按照备案表要求及评估要点，组织技术团队、法务团队、数据团队等多部门协作，准备相关材料，确保材料真实、全面。
企业内部评估，编写材料，准备测试账号：企业内部开展自评估，确保大模型在技术、安全、合规等方面符合要求。同时，编写详细的材料说明，准备测试账号（一般包括 10 个附加安全审核账号、10 个裸奔账号）及测试文档，以便审核人员验证模型实际运行情况。
提交材料和测试账号给属地网信办审核：将准备好的材料和测试账号提交给属地网信办审核，审核期间保持沟通畅通，及时回应审核人员的问题和反馈。
审核通过，上报中央网信办；未通过，根据反馈调整：属地网信办审核通过后，将备案材料上报至中央网信办进行复审；若审核未通过，企业需根据反馈意见进行调整，并重新提交材料。
中央网信办复审，通过下发备案号；未通过，重新备案：中央网信办对上报材料进行复审，通过后下发备案号，标志备案成功；若未通过，需根据反馈意见再次调整，并重新提交备案申请。

六、备案过程中的注意事项

时间周期：大模型的备案和登记整个过程因涉及资料准备、测试等众多环节，大约需要 3 - 4 个月左右的时间，算法备案时间周期大概为 2 个来月，企业需提前规划，避免延误。
境外模型风险：使用境外基座模型，或者爬取境外门户网站数据的企业，在裸奔测试中可能难以通过，因为境外模型和数据可能存在安全风险、不符合国内监管要求等问题，需格外谨慎。
特定行业限制：医疗健康、金融及企查查类型企业，目前暂时无法办理大模型备案，但可办理大模型登记手续，以满足业务需求并符合监管政策。
材料真实性：在填报材料时，务必确保所提供信息真实、全面，不遗漏任何重要细节或信息，否则可能导致备案失败。
评估报告详尽性：撰写评估报告时，要详尽描述各项评估内容，并形成明确结论，有助于审核人员更好了解大模型的安全性和合规性。
测试题集标准：准备测试题集时，要确保其满足《生成式人工智能服务安全基本要求》的相关标准，提高测试题集质量，增加审核通过的可能性。

七、备案后的管理

悬挂备案号：通过备案或登记后，企业需在显眼位置悬挂备案号，这既是合规标志，也是对公众的透明展示。
配合常态化安全测试：每月会进行常态化安全测试，企业要积极配合，确保大模型服务始终处于安全、合规的运行状态。一旦发现问题，及时整改，以持续满足监管要求。

八、结语

AI 大模型备案全流程是一个系统且严谨的过程，虽然繁琐，但对于企业和整个 AI 行业的长远发展至关重要。企业和开发者需认真对待每一个环节，严格按照要求准备资料、完成备案流程。在备案过程中，不断提升自身技术水平和合规意识，以适应日益完善的监管环境。相信随着备案制度的有效实施，AI 大模型将在安全、合规的轨道上释放更大的价值，为社会发展做出更多积极贡献。未来，随着技术的不断进步和监管政策的持续优化，AI 大模型备案流程也可能会有所调整和完善，相关企业和开发者需持续关注政策动态，及时调整备案策略和措施。