理论动态 | 数据基础设施(第6期)

2023年11月23日,国家数据局党组书记、局长刘烈宏在出席第二届全球数字贸易博览会数据要素治理与市场化论坛致辞时,首次就数据基础设施做重要论述。

● 解读

数据基础设施建设的重要意义:

国家数据基础设施(NDI)是经济社会进入数据要素化发展新阶段,支撑数据要素基础制度实施,支持数据资源开发利用落地,全面促进数字中国、数字经济、数字社会高质量发展的平台和载体。

具体来讲,一是将与数据基础制度的落地和数据资源开发利用的实施一起,共同为数据要素产权确权、收益分配、交易流通、安全治理等核心问题的解决发挥作用。目前来看,由于数据的虚拟性、非排他性等一些特性的存在,需要全新的承载数据要素价值释放的基础设施,也就是数据基础设施。对于这一概念,业界的研究还比较初步。数据汇聚、流通、运营等环节还有很多技术难点没有解决。此外,数据基础设施是数据基础制度落地的抓手,但数据确权、收益分配、交易流通、安全治理等方面还有很多制度性问题没有解决(中国信通院云计算与大数据研究所所长何宝宏)。二是数据基础设施也将对扩大数据产业规模、繁荣数据产业生态、促进数字经济高质量发展产生重要意义。在数据基础设施的推进过程中,一定会带动相关产业发展,为数据产业生态的繁荣发挥重要作用。同时,技术创新也是数据基础设施推进的关键。数据基础设施在数据的全生命周期都需要技术的支持,比如数据汇聚环节的区块链技术,数据流通环节的隐私计算等等。据业界初步估算,数据基础设施每年将吸引直接投资约四千亿元,带动未来五年投资规模约两万亿元。

什么是数据基础设施:

数据基础设施是从数据要素价值释放的角度出发,在网络、算力等设施的支持下,面向社会提供一体化数据汇聚、处理、流通、应用、运营、安全保障服务的一类新型基础设施,是覆盖硬件、软件、开源协议、标准规范、机制设计等在内的有机整体。

国家数据基础设施(NDI)纵向上从顶到底分别是国家数据空间、国家软基础设施、国家硬基础设施、国家数据安全基础设施等四层架构,横向上覆盖数据采存算管用全生命周期各环节,包括数据采集平台、数据汇聚平台、数据加工平台、数据共享平台、数据开放平台、数据运营平台、数据交易平台和数据存储平台等。

国家数据基础设施构成

国家数据基础设施(NDI)在基础设施形态、数据全生命周期、行业和区域空间三个维度相互融合、相互支撑,形成支持数据全生命周期不同环节、不同行业、不同区域数据要素化的统分结合架构

(资料来源:北京交通大学信息管理理论与技术国际研究中心(ICIR)特聘教授张向宏受邀作为主论坛嘉宾发表题为《构建新一代数据基础设施,激活数据要素价值潜能》的演讲)

一是国家数据基础设施纵向架构国家数据空间、国家软基础设施、国家硬基础设施、国家数据安全基础设施。国家数据空间是国家数据基础设施(NDI)的核心,由国家公共数据基础空间、国家行业数据空间、国家区域数据节点空间组成,能够提供自主操作、公平共享和交换、可信管理和认证、以及互操作等可信安全操作。国家软基础设施是国家数据基础设施(NDI)的关键,包括两部分内容,一是接入数据空间的各类主体、工具和数据的各种标准、协议、身份认证器和授权连接器;二是各种标准化和智能化的通用算法、模型和工具。国家硬基础设施是国家数据基础设施(NDI)的基础,包括国家信息基础设施和国家数字基础设施,国家数字基础设施又包括算力基础设施建设和融合基础设施等。国家数据安全基础设施是国家数据基础设施(NDI)的保障,纵向贯通国家硬基础设施、国家软基础设施、国家数据空间全层级,横向覆盖数据采存算管用全生命周期各环节的全国一体化数据安全监管平台,包括全国一体化数据安全信息收集、分析和通报平台,数据安全监测预警平台,数据安全应急处置平台和数据安全监督管理平台。

二是国家数据基础设施横向架构:数据采集平台、数据汇聚平台、数据加工平台、数据共享平台、数据开放平台、数据运营平台、数据交易平台和数据存储平台。数据采集平台以政务数据采集为基础,建立健全以数据库采集、系统日志采集、网络数据采集、感知设备数据采集等数据采集技术为基础的标准化和智能化数据采集平台。数据汇聚平台依托全国一体化政务服务平台建立全国公共数据服务平台。数据加工平台依托全国公共数据服务平台,建立健全集成自然语言处理、视频图像解析、智能问答、机器翻译、数据挖掘分析、数据可视化、数据融合计算等功能的构建通用算法模型、工具和构件,将人工智能技术深度应用于数据标注、数据分析、数据挖掘等数据加工生产流程中。数据共享平台进一步建立完善现有国家数据共享交换平台,实现政务数据在全国各政务机关跨地区、跨部门、跨层级共享和交换。数据开放平台进一步建立完善现有国家数据开放平台,不断增加公共数据开放数量,持续提高公共数据开放质量。数据运营平台充分利用数据目录、数据集成、数据迁移、数据访问、数据传输等各种数据管理技术,以及区块链技术和各种隐私技术,依托全国一体化政务服务平台建立各地区各部门公共数据运营平台,推动公共数据授权运营、特许开发和融合应用开发等不同数据运营方式。数据交易平台依托上海、北京和深圳等数据交易所已建立起来的数据交易平台,通过机器学习、隐私计算、区块链等先进技术,聚焦数据核验、可信操作、智能合约、跨链协同等功能,建设“上海+北京+深圳”等数据交易所全面联通的全国数据交易平台,提供全国范围的数据产品交易、数据资产凭证服务、数据流通交易合规监管等数据交易全过程服务,实现“一方备案,全链共享;一地挂牌,全链流通;一站交易,全链可溯;一证颁发,全链互认”。数据存储平台充分利用结构化数据存储、列式数据库、文档数据库、图数据库、搜索数据存储、非结构化数据存储、数据湖、蓝光存储等数据存储技术,建立“一地三中心”的本地、异地双容灾备份的国家数据存储中心。

国家数据基础设施的三个障碍

一是互操作性障碍:将不同行业、不同地区、甚至不同国家种类繁多的各种数据主体、数据产品、数据工具置于一个统一的数据基础设施平台和空间上,遇到的最大障碍就是相互间的互操作性。包括同一环节的互操作、多个环节的互操作、跨行业跨区域跨国别的互操作。

二是场景规模化障碍:数据全生命周期场景规模化,数据基础设施目前仅在数据交易平台环节投资较大,应用较多,而在数据采集、汇聚、共享、开放、运营和存储等其他环节还未形成集中化、规模化应用。更多的行业和地区场景规模化,数据基础设施目前仅在部分政务部门建立了政务数据汇聚、共享、开放、运营和存储等基础设施平台,还没有覆盖到各行业各地区。大众日常工作生活场景规模化,数据基础设施仅在政务应用和部分2B场景有所应用,还没有覆盖到广大的商用和民用领域,特别是还没有覆盖到众多的互联网数据平台。

三是技术成熟度障碍:数据基础设施的有效性在很大程度上取决于各种隐私计算的技术成熟度和隐私计算技术与传统技术的融合程度。隐私计算技术的成熟度和公认度。目前在实践中得到应用的隐私计算技术还远未成熟,主要表现在两方面,一是隐私计算技术种类众多,但还没有一项成熟的技术。不同机构、不同产品使用了联邦计算、去标识化、同态加密、零知识证明、合成数据、可信执行环境等不同隐私计算技术;二是隐私计算技术路线多样化,还没有一条得到市场公认,相互间不兼容、不可互操作。隐私技术的云计算、大数据和区块链等技术的融合。目前云计算、大数据和区块链等技术在信息网络基础设施和算力基础设施已实现融合,随着数据基础设施不断发展完善,各种隐私技术也将与云计算、大数据和区块链等技术不断融合,实现创新发展。以隐私技术为核心的数据连接器和数据认证器的部署。在现有云计算架构下,数据连接器和数据认证器的部署形态是以公有云和私有云方式部署的。随着数据基础设施继续深化发展,数据连接器和数据认证器将以一体机形态在各行业各地区数据空间部署。

参考资料

刘烈宏:在第二届全球数字贸易博览会数据要素治理与市场化论坛的致辞,链接:首次提出数据基础设施建设 刘烈宏解读国家数据局工作任务 (baidu.com)

北京交通大学信息管理理论与技术国际研究中心(ICIR)特聘教授张向宏:2023全球数商大会上海,链接【数据基础设施】张向宏教授解读国家数据基础设施(NDI)

  • 21
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值