大模型备案VS算法备案:差异、要求与合规快照【附附件】

​下图为最新的直至第五批深度合成服务算法备案信息的公告

根据目前公开的国内大模型算法备案统计来看,首批境内深度合成服务算法备案清单,总共通过了五批。

以第二批举例,境内深度合成服务算法备案清单,总共通过110家,其中25家上市公司、互联网大厂和独角兽企业成功申报算法备案72个,占比高达65%,29家新兴互联网公司成功申报算法备案38个,平均每家企业成功申报4个算法备案。而35家互联网小厂,总共仅有47个算法通过备案,仅占比31.2%,平均每家企业只成功申报1.3个算法。

截止第五批全国通过算法备案的有940家企业,首批境内深度合成服务算法备案清单中共有41家公司通过备案。第二批有110家公司通过备案,第三批为129家,第四批有266家,第五批有394家,可以看出备案通过的家数在逐批次增多。

​《互联网信息服务算法推荐管理规定》发文单位:国家互联网信息办公室,为了规范互联网信息服务中的算法推荐活动、促进互联网信息服务健康发展、保护用户权益而制定的专门性部门规章。该规定自2022年3月1日起施行,由国家互联网信息办公室联合工业和信息化部、公安部、市场监管总局共同发布。

《生成式人工智能服务管理暂行办法》(下称“《办法》”)由国家互联网信息办公室(“网信办”)、国家发展和改革委员会、教育部、科学技术部、工业和信息化部(“工信部”)、公安部、国家广播电视总局共七部委于2023年7月10日联合发布。2023年8月15日正式生效。

根据《办法》第2条、第17条规定,凡是利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容服务的的组织、个人,凡是提供具有舆论属性或者社会动员能力的生成式人工智能服务,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。现在,《办法》已明确指出服务提供者应当按照有关规定开展安全评估,并履行算法备案手续。

《办法》明确,备案主体不仅包括深度合成服务提供者,还包括深度合成服务技术支持者,备案的对象是深度合成服务,即应用深度合成技术提供的互联网信息服务,均需要履行备案义务。

算法备案群体

以API接入或者私有化形式提供服务,以服务技术支持者进行备案;

以APP、网页等提供深度合成产品服务实体,以服务提供者进行备案;

同一种算法用于不同应用产品时,需要一项备案即可;

同一款产品触及多类算法,应当申请多个算法备案;​

算法备案时间要求

厂商应当在提供服务之日起十个工作日内提交材料,三十个工作日内予以备案,发放备案编号并进行公示;

算法备案信息发生变更,在变更之日起十个工作日内办理变更手续;

终止提供服务,需要在终止服务之日起二十个工作日内办理注销备案手续;

未履行算法备案需承担相应法律责任

未履行备案义务时,网信、公安等监管部门依据职责给予警告、通报批评,责令限期改正;

拒不改正或者情节严重的,责令暂停信息更新,并处1万元以上10万元以下罚款;

算法推荐服务提供者通过隐瞒有关情况、提供虚假材料等不正当手段取得备案的,由国家和省、自治区、直辖市网信部门予以撤销备案,给予警告、通报批评;

情节严重的,责令暂停信息更新,并处1万元以上10万元以下罚款;

算法备案需要提交的材料:

《算法备案承诺书》《落实算法安全主体责任基本情况》《算法安全自评估报告》《拟公示内容》。

充分理解备案政策法规要求:

《生成式人工智能服务管理暂行办法》、《互联网信息服务深度合成管理规定》、《互联网信息服务算法推荐管理规定》等。

大模型备案和算法备案是针对不同类型的人工智能应用和服务的管理措施,它们的主要区别体现在备案对象、目的、要求和流程等方面。

备案对象:

大模型备案:主要针对的是生成式人工智能(AIGC)产品,特别是那些具有舆论属性或社会动员能力的大型语言模型或深度合成模型。这些模型通常需要大量的数据训练,能够生成文本、图片、音频、视频等内容。

算法备案:则更广泛地适用于各种算法推荐服务,包括但不限于个性化推送、排序精选、检索过滤等,这些服务通过算法向用户提供信息或内容推荐。

备案目的:

大模型备案:旨在确保大模型在提供服务前符合国家的安全和合规要求,防止可能的风险,如误导用户、传播违法信息等。

算法备案:则侧重于规范算法推荐服务的行为,保护用户权益,防止算法歧视、“大数据杀熟”等不合理应用,维护网络信息传播秩序和市场秩序。

备案要求:

大模型备案:通常要求企业在模型上线前进行安全评估,提交详细的安全自评估报告,以及模型服务协议、语料标注规则等材料,并可能需要通过专业的第三方评估。

算法备案:要求企业在提供服务前,根据算法类型和应用领域,填报算法基础属性信息和详细属性信息,包括算法数据、模型、策略、风险与防范机制等,并提供算法安全自评估报告等。

备案流程:

大模型备案:流程可能包括准备材料、提交备案申请、审核、获得备案号等步骤,具体流程可能因地区和模型类型而异。

算法备案:通常需要企业登录互联网信息服务算法备案系统进行主体信息和算法信息的填报,并通过系统提交相关材料,审核通过后获得备案号。

备案成本对比:

自己写

找第三方做备案

时间成本

不确定。涉及学习时间和反复修改时间。学习难度大,需要从头学习并理解相关法规和要求,揣度得分要点。审核流程不够透明,需要反复试错,自己备案没有经验。自己写的话,备案审核时长平均8个月,驳回一次等3个月,可能会影响产品上线。

2-3个月左右拿到备案号

人力成本

需要同时具备算法研发、AI、安全、法务专业经验的人员。需要组织跨部门联合小组共同推进。

只需要少量算法技术配合即可

通过率

不确定,可能会影响产品上线

模型和数据合规合法,都可以通过

花费

N个月*M个人*每月人力成本

远低于自己探索的成本

  • 16
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
模型数据工程师和大模型算法工程师在工作职责和技能要求上有一些不同之处。 大模型数据工程师主要负责处理和管理大规模数据集,确保数据的高效存储、处理和访问。他们需要具备以下技能: 1. 数据处理和清洗:能够使用各种工具和技术对大规模数据进行清洗、转换和整合,以满足算法工程师的需求。 2. 数据存储和管理:熟悉各种数据库和分布式存储系统,能够设计和维护高性能的数据存储方案。 3. 数据管道和工作流:能够构建和管理数据管道,实现数据的自动化流程,提高数据处理的效率。 4. 分布式计算:了解分布式计算框架,如Hadoop、Spark等,能够利用这些框架进行大规模数据处理和计算。 大模型算法工程师主要负责设计和实现大规模机器学习和深度学习模型,以解决复杂的问题。他们需要具备以下技能: 1. 机器学习和深度学习算法:熟悉各种机器学习和深度学习算法,并能够根据具体问题选择合适的算法。 2. 模型设计和优化:能够设计和优化大规模模型的结构和参数,以提高模型的性能和效果。 3. 分布式训练和推理:了解分布式训练和推理的原理和技术,能够利用分布式计算资源进行大规模模型的训练和推理。 4. 模型评估和调优:能够评估模型的性能,并进行调优以提高模型的准确性和效率。 总结来说,大模型数据工程师主要关注数据的处理和管理,而大模型算法工程师则专注于机器学习和深度学习模型的设计和实现。他们在解决大规模数据和模型相关问题时会有不同的职责和技能需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值