数据空间,Dataspace综述

最近在搭建简单的Dataspace,做了很多很多研究,部分内容放这里,有需要的可以看看,有正在搭建数据空间的也可以一起讨论研究。

一、数据空间概念和技术基础

数据空间的概念是⼤约15年前在计算机科学中创造的。数据空间是当时作为数据集成概念引⼊的。与中央数据集成⽅法(例如,数据整合中⼼)相⽐,数据空间不需要数据的物理集成,⽽是将数据存储在源处[1][2]。除此之外,它们不需要来⾃不同来源的数据必须遵守的通⽤数据库模式。例如,集成是使⽤共享词汇表在语义级别上实现的。因此,数据空间允许数据冗余和数据“共存”。此外,数据空间可以嵌套和重叠,以便各个参与者可以成为多个数据空间的⼀部分。

除了数据空间的原始技术定义之外,该术语在商业界的使⽤增加也导致⼈们将数据空间概念理解为数据协作的⼀种形式。各个⼯业领域的从业者将数据空间解释为⼀种由实现共同⽬标的愿望驱动的业务协作格式。⼀个例⼦是 Catena-X,这是由德国汽⻋⾏业部分部⻔发起的倡议,旨在建⽴⼀个数据空间,允许在汽⻋供应和⽣产⽹络中集成可信数据链。数据空间的业务定义是指参与者联盟之间的⽬标、决策权和流程。

国际数据空间 (IDS) 计划于 2015 年与 Fraunhofer 共同发起由德国联邦教育和研究部资助的研究项⽬[3]。国际数据空间 (IDS) 是一个利用现有标准和技术,以及在数据经济中广为接受的治理模型,以促进安全可信业务生态系统中的标准化数据交换和数据链接[4][5]。它由此为创建智能服务场景和促进跨公司创新提供基础业务流程,同时保证数据所有者的数据主权。

二、数据空间的目标

数据⽣态系统中的数据共享始终需要信任。参与者必须信任系统本⾝,但也要信任数据⽣态系统中的其他参与者获得有价值的数据,这些数据只能根据数据提供者定义的使⽤策略来使⽤。因此,信任是国际数据空间的基础[5]。 IDS 中的每个参与者和软件在获得⽣态系统访问权限之前都将经过认证。

安全与信任密切相关。IDS 中的所有系统都必须实现最先进的安全性,同时保证信任和数据主权,因此,安全要求也是认证标准的⼀部分[7][8]。

 数据主权是国际数据空间(IDS)的⼀个基本⽅⾯。它可以定义为⾃然⼈或法⼈实体对其数据完全⾃主决定的能⼒。这意味着数据所有者可以在与数据消费者共享数据之前定义对其数据的使⽤限制。数据消费者必须接受使⽤限制。

数据⽣态系统使新的商业模式成为可能,⽽个体参与者由于缺乏完整的数据⽽⽆法⾃⼰实现这些模式。没有哪个参与者拥有提供创新服务所需的全部数据。因此,数据⽣态系统需要数据空间来⽀持这些新的创新服务。

建⽴数据空间需要标准化的互操作性,因为不同的数据⽣态系统将以不同的格式和协议交换不同类型的数据[9]。只有互操作性标准化,各个系统才能在IDS中互操作。因此,IDS架构在参考架构模型中定义,数据和端点在信息模型中进⾏语义描述,认证确保每个系统都遵循架构并以定义的⽅式使⽤信息模型。此外,还有定义 IDS 连接器的DIN Spec 27070。

三、数据空间研究现状

有一个执行数据主权的“空间”,称为数据空间。该术语最初被称为工业数据空间,最近更新为国际数据空间(IDS),以反映构建跨越国界的数据共享生态系统的愿景[7]。Otto和Jarke[8]认为,IDS倡议是各个国际研究机构和工业企业的共同努力,旨在建立一个安全可信的数据共享的去中心化平台。布劳德等人[5]还指出,IDS旨在允许建立数据驱动的生态系统,其中独立合作伙伴(来自不同规模、生态系统和财务实力)信任外部各方如何处理其数据,同时允许合作构建创新数据服务,在数据主权和信任之间建立一种长期成功合作(即经过验证的信任)或获得的能力(即强制信任)的关联。而且,以IDS的组织和技术准则为支撑的商业生态系统可以称为基于IDS的商业生态系统。

随着数字经济的深入发展,数据要素的支撑作用变得愈发重要。从德国探索构建工业数据空间架构模型,到《欧洲数据战略》明确提出建设以工业为代表的九大行业数据空间,再到日本提出建设“互联产业开放框架”,发达国家展现出抢抓工业数据共享流通主导权的战略意图。

国内在推动新一代信息技术与制造业融合发展以及工业互联网发展的战略部署之下,工业数据安全、合规、可信流通渐渐被关注。工信部于2020年印发《关于工业大数据发展的指导意见》[16],提出了建设工业数据空间的重点任务;2021年印发《工业互联网创新发展三年行动计划(2021-2023年)》[17],再次提出探索建立工业数据空间,推动数据开放共享;2022年1月,在中国信息通信研究院举行的可信工业数据空间生态链大会上发布《可信工业数据空间系统架构1.0》白皮书,提出了可信工业数据空间的初步架构以及标准体系。2022年9月,可信工业数据空间生态链成员单位数鑫科技在深入研究IDSA参考架构的基础之上,结合国内特点和需求,发布了领域数据空间(Domain Data Space,简称DDS)流通平台。这是国内第一款基于数据主权控制下,数据跨域、分发、使用、连接的数据空间商业化产品。基于该平台的方案在以港口为中心的多式联运场景进行了探索应用,但距离成型的数据空间还有较长距离。尽管我国高度重视数据空间技术的发展,然而目前尚未出台系统性的计划以构建医疗数据空间。

四、数据空间技术框架

数据空间由值得信赖的合作伙伴之间的关系组成,这些合作伙伴受 IDSA 标准管辖,为欧洲和世界各地的商业和工业提供安全和主权的数据交换、认证和治理。

公司拥有大量宝贵的数据,但无法保护、共享或货币化。IDSA 标准通过具有统一规则、经过认证的数据提供者和接收者以及合作伙伴之间的信任的数据空间实现数据共享。数据空间为未来数据经济中富有成效的合作、降低进入壁垒和无限创新提供了基础[11]。

当更多的公司将 IDS 作为首选的数据交换模式,并且当官方标准和治理机构采用它作为具有约束力的全球标准时,这个未来才真正到来。

4.1.1国际数据空间组成部分

数据空间是主权数据交换发生的地,IDS 标准可根据双方商定的规则,在经过认证的数据提供者和接收者之间进行可信的数据交换。数据空间改善合作、降低进入壁垒并增强创新[19]。

Data Provider数据所有者和数据提供者:数据提供者是通过IDS连接器将所有者的数据传输到数据空间的设备。它允许其他人使用数据,同时保留对谁、如何、何时、为什么以及以什么价格的控制。这就是数据主权,是释放数据价值的基础。

Data Consumer数据用户和数据消费者:数据消费者是代表用户处理数据的设备。数据由数据提供商根据其使用政策提供,并对数据的质量和可靠性充满信心。这就是数据发挥其价值的方式。这也是数据主权。

Data Provider和Data Consumer通过IDS Connector连接到数据空间,IDS 连接器是一个专用软件组件,允许参与者将使用策略附加到数据空间中的数据、强制执行使用策略并无缝跟踪数据来源。连接器充当数据和服务的网关以及应用程序和软件的可信环境。

图1 数据空间基础架构

Broker提供有关数据源的内容、结构质量、货币和其他特征的信息。

Clearing House是 IDS 内所有数据交换和金融交易的清算和结算服务。

App Store提供可部署在 IDS 连接器中的应用程序,以执行转换、聚合或数据分析等任务。

Identity Provider创建、维护、管理和验证 IDS 参与者的身份信息。

Vocabulary根据公认的最佳实践提供数据的标准化描述符。

4.1.2国际数据空间的角色

参与者可以扮演不同的⻆⾊,根据互动和组织的级别,这些⻆⾊被分配到不同的类别,详细描述如下(表4.1 中总结)。

第⼀类 核⼼参与者

数据所有者、数据提供者、数据消费者、数据⽤⼾、应⽤程序提供者

第⼆类 中介参与者

元数据经纪服务提供商、票据交换所、⾝份提供商、应⽤商店、词汇提供商

第三类 软件和服务

软件提供商、服务提供商

第四类 治理机构

国际数据空间协会、认证机构和评估设施

表4.1 国际数据空间各类角色

第一类:核⼼参与者

IDS 中每次数据交换都需要核⼼参与者参与和需要。分配给此类别的角色是数据所有者、数据提供者、数据消费者和数据⽤⼾。

第二类:中介机构

中介机构充当受信任的实体。分配给此类别的⻆⾊包括元数据代理服务提供商、票据交换所、应⽤程序商店、词汇提供商和身份提供商。只有受信任的组织才能承担这些⻆⾊。

    IDS 的联合架构提供了(实际上)集中式组件的操作,这些组件映射了数据空间内服务交付的各个⽅⾯。也就是说,这些是上述的核⼼组件,但连接器除外,它以分散的⽅式运⾏。这些组件中的每⼀个都必须在功能正常的数据空间中集成、操作和维护。这些活动由服务提供商作为中介执⾏。这里需要提到的是,所有组件可以有⼀个服务提供者,也可以有单个组件有不同的服务提供者。

第三类:软件和服务

该类别包括向IDS 参与者提供软件和/或服务(例如,以软件即服务模型)的IT 公司。此类别下包含的⻆⾊包括应⽤程序提供商、服务提供商和软件提供商。

软件提供商:提供⽤于实现 IDS 所需功能的软件。与数据应⽤程序不同,软件不是由应⽤程序商店提供,⽽是通过软件提供商的通常分销渠道交付,并根据软件提供商和⽤⼾(例如数据消费者、数据提供商或经纪服务提供商)之间的单独协议使⽤。

服务提供商:如果参与者本⾝没有部署参与 IDS 所需的技术基础设施,则它可以将 IDS 中可⽤的数据传输给托管其他组织所需基础设施的服务提供商。该⻆⾊还包括提供附加数据服务(例如,数据分析、数据集成、数据清理或语义丰富)的提供 商,以提⾼ IDS 中交换的数据的质量。

第四类:管理机构IDS由认证机构和国际数据空间协会管理。

    国际数据空间协会是⼀个促进数据空间持续发展的⾮营利组织。它⽀持并管理参考架构模型的开发。国际数据空间协会⽬前由多个⼯作组组成,每个⼯作组处理⼀个特定主题(例如架构、⽤例和要求或认证)。协会会员主要为⼤型⼯业企业、IT企业、中⼩企业、研究机构、⾏业协会等。

认证机构和评估机构 认证机构和评估机构负责对 IDS的参与者和技术核⼼组件进⾏认证。

4.1.2使用控制

除了控制对某些资源的访问的经典访问控制之外,IDS 参考架构还侧重于以数据为中⼼的使⽤控制[4]。其⽬的是即使在访问后也给予数据使⽤限制。这是通过将规则绑定到交换的数据来实现的,这些数据可以连续控制,例如如何处理、聚合消息或将消息转发到其他端点。⼀⽅⾯,以数据为中⼼的视图允许⽤⼾持续控制数据流,⽽不仅仅是访问。另⼀⽅⾯,通过 IDS 连接器进⾏使⽤控制可确保数据不会以不期望的⽅式进⾏处理,例如将个⼈数据转发到公共端点[22][23]。

为了说明使⽤控制的相关性,可以给出仅使⽤访问控制⽆法实现的⽰例。在保密⽅⾯,可以做到机密数据不能被数据消费者转发给未经授权的第三方[24]。可以通过确保例如两个竞争公司的数据集不由服务中的同⼀第三⽅聚合或处理来实现职责分离。这使公司能够控制⾃⼰的数据不被第三⽅使⽤以使其直接竞争对⼿受益。

使⽤控制是通过控制点监控数据流来实施的。在这些检查点内,决策引擎决定允许、拒绝或对数据进⾏必要的修改。所需的限制必须由数据所有者正式定义。⽤⼾友好的图形界⾯可⽤于此⽬的,将规格转换为机器可读的输出。使⽤限制可以通过两种不同的⽅式附加到数据上。⼀⽅⾯,使⽤限制可以直接附加到数据上。例如,只有在保证遵守使⽤限制的情况下才能进⾏解密。另⼀⽅⾯,使⽤限制可以独⽴于数据存储在中央实例中。在这种情况下,必须在系统之间交换使⽤限制。

    连接器中集成的策略编辑器(策略管理点,PAP)可⽤于指定使⽤限制。

  • 49
    点赞
  • 55
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值