在生成式人工智能服务领域,目前已经形成了由算法备案制度和生成式人工智能备案(下称“大模型备案”)构成的“双备案制”的实践机制。大模型备案作为算法备案的子类,截至2024年底,全国已有302款生成式人工智能服务完成国家网信办备案,其中2024年新增备案238款。对于通过API接口或其他方式直接调用已备案模型能力的生成式人工智能应用或功能,2024年共105款在地方网信办完成了登记。
2025年,随着DeepSeek的开源,降低了大模型部署的门槛与成本,越来越多的企业接入DeepSeek,包括中国移动、中国电信、中国联通等三大电信运营商以及微信等互联网应用。这些企业不仅在自身产品和服务中应用了DeepSeek,还针对其热门模型提供专属算力方案和配套环境。
那么,对于接入DeepSeek开源大模型的企业是否需要备案,进行何种备案,本文将从大模型应用合规的备案体系,系统梳理生成式人工智能服务领域相关的备案要求、具体流程、所需材料等,为大模型合规运营提供备案参考攻略。
1.为什么要做算法备案和大模型备案?
(1)算法备案
根据国家网信部、公安部、工信部、国家市监总局一起联合发布出台的《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》和《生成式人工智能服务管理暂行办法》的文件中,凡在中国境内,应用算法推荐技术向用户提供互联网信息服务的企业或机构,必须依法进行算法备案。
《互联网信息服务算法推荐管理规定》第二十四条规定,具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息,履行备案手续。
《互联网信息服务深度合成管理规定》第十九条规定,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。深度合成服务技术支持者应当参照履行备案和变更、注销备案手续。
《生成式人工智能服务管理暂行办法》第十七条规定,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
(2)大模型备案
《生成式人工智能服务管理暂行办法》第十七条指出,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估。这里所说的安全评估,其实就是生成式人工智能服务备案。
2. 算法备案与大模型备案的区别?
(1)算法备案:面向对象更为广泛,涵盖了各类算法服务,包括但不限于个性化推送类、排序精选类、检索过滤类、调度决策类以及生成合成类(含深度合成服务)等多种算法类型。无论是简单的推荐算法,还是复杂的决策算法,只要涉及算法服务的提供,均在算法备案的范畴之内。
(2)大模型备案:主要适用于提供生成式人工智能服务的主体,此类服务通常基于深度学习或机器学习模型,通过对大量数据的学习和训练,生成文本、图像、音频等内容。例如,常见的语言生成模型、图像生成模型等。
两者在审核重点、审核方式、提交途径等多方面都有不同,详见下图:
3. 备案判断准则
(1)已完成算法备案,是否还需进行大模型备案?
判断依据在于产品属性。若算法属于“提供生成式人工智能服务” 的 AI 产品,即便已完成算法备案,仍需进行大模型备案。因为大模型备案针对生成式人工智能服务有更为严格和针对性的监管要求,旨在确保生成内容的质量和安全性。
(2)已完成大模型备案,是否还需进行算法备案?
需要。由于生成式人工智能服务属于生成合成类算法,是算法备案的类型之一,因此完成大模型备案后,仍需按照算法备案的要求进行备案,完成“双备案”,以全面履行合规义务。
4. 接入DeepSeek的企业,要进行哪种备案?
(1)场景1:直接接入DeepSeek使用,未做任何二次开发、优化或微调等操作,产品上线后对境内客户提供服务。
需做登记:根据国家网信办的要求,直接调用三方接口的无需做大模型申报备案,但需向省网信办做大模型的登记手续。
(2)场景2:调用API接入DeepSeek后,进行二次开发、优化或微调等,产品上线后对境内客户提供服务
需算法及大模型备案:作为运营主体,在DeepSeek基础上进行了改动后为自己所有,且面向境内客户提供服务的企业,需要进行算法及大模型备案。因为微调可能会改变模型的输出结果和行为,从而影响其安全性和合规性。
(3)场景3:私有化部署DeepSeek,对DeepSeek二次开发
需算法及大模型备案:若企业对DeepSeek进行私有化部署(如本地服务器或私有云),并作为自有服务对外提供,需同时完成大模型备案和算法备案。
(4)场景4:接入DeepSeek仅供公司内部使用
无需备案:如果企业接入DeepSeek仅用于内部业务流程,且不对外提供服务,那么通常无需进行算法备案。因为内部使用的算法服务不涉及公众利益和舆论属性,其风险相对可控。不过,企业仍需确保内部使用的算法符合数据安全和隐私保护的相关要求。
(5)场景5:个人接入DeepSeek自己使用
无需备案:对于个人用户来说,接入DeepSeek仅供自己使用是无需进行备案的。算法备案主要针对企业或机构提供的面向公众的服务,个人使用不属于备案范围。
(6)场景6:接入DeepSeek面向专业特定领域使用
无需备案:如果接入DeepSeek的服务仅面向特定领域的专业人士,且不涉及公众利益或舆论属性,那么通常也无需进行备案。不过,企业仍需注意在使用过程中遵守数据安全和隐私保护的相关规定。
5. 算法备案流程及资料
(1)备案形式:通过线上的互联网信息服务算法备案系统进行申请,操作相对便捷
(2)备案材料:
主体信息填报:企业到官方备案网站互联网信息服务算法备案系统上完成账号注册以及主体信息填报,填报完成后需等待后台工作人员审核通过方可继续填报算法信息和产品及功能信息。
算法信息填报:包括《算法安全自评估报告》、拟公示内容和算法详细属性报告。公示指的是算法透明度,具体功能和逻辑;属性指的是基础属性和包括数据、模型、策略、风险防范机制在内的详细属性。通常会在30个工作日内得到答复。
产品及功能信息填报:关联产品及功能信息或填报技术服务方式,这一步需与算法信息填报一并递交审核。
(3)备案审核要点及流程
审核要点:核实算法主体信息,如法人、安全责任人等的准确性和完整性,确保责任主体明确;审查算法安全自评估报告,重点关注流程、数据、模型、干预策略、风险评估和防范等制度的完整性,以切实保障算法的安全性。
流程周期:通常为 2 个月左右。中央网信办每 1 - 2 个月公示一批次备案号,企业可据此及时了解备案进度和结果。
6. 大模型备案流程及材料要求
(1)备案形式:采用线下备案方式,需到属地网信办提交材料,要求企业充分准备,确保材料的准确性和完整性。
(2)备案材料:
附:拦截关键词列表
(3)备案审核要点及流程
审核要点: 审查附件材料,重点关注模型架构安全、训练数据来源的合法性和合规性,是否涉及知识产权问题以及非法拦截的有效性等;网信办会邀请专业的第三方检测机构通过测试账号对大模型进行接口测试和安全评估,验证其安全性和稳定性。特别需要注意的是,对敏感内容的拒答率应达到 95% 以上 。
流程周期:3 - 6 个月,时间跨度较长
7. 大模型备案的难点
(1)语料安全评估的高标准
语料来源合法性:需确保训练语料来源合法,包括开源、自采、商业三类语料的授权证明。
语料内容安全要求:需通过关键词、分类模型、人工抽检等多重方式过滤违法不良信息,确保语料中不良信息比例低于5%。人工抽检需从全部语料中随机抽取至少4000条,合格率不低于96%。
(2)模型安全评估的复杂性
生成内容安全测试:生成内容测试题库应具有全面性,总规模不应少于2000题,需覆盖拦截关键词列表中的31种安全风险类型
技术合规要求:2025年9月1日起,《人工智能生成合成内容标识办法》将正式施行,企业利用生成式AI技术提供服务,需对生成的内容添加显式标识或隐式标识。建议相关企业在申请备案上线前,配置好内容标识能力。
DeepSeek的开源模式虽大幅降低了大模型技术门槛,但企业在享受技术普惠红利的同时,合规性始终是业务落地的第一道关卡。数美科技在大模型内容领域积累了丰富的实践经验,为多家AIGC企业提供了备案服务支持,也期待能为更多大模型的成功上线及健康发展赋能,做新业态的护航者。