点击上方蓝字关注我们
链上存证、链下传输的可信数据共享平台
张召1, 田继鑫2, 金澈清1
1 华东师范大学数据科学与工程学院,上海 200062
2 MCT Technology,上海 200023
摘要:区块链系统可以为分享数据的互不信任的多方之间提供可信的基础设施。但是,将原始分享数据直接上链的方式并不适合大规模的数据分享场景。因此,提出了一种数据共享请求和应答记录上链存证、原始数据链下安全传输的数据共享平台架构,该架构在一定程度上可以缓解系统负载过重以及隐私保护方面的问题。最后总结了随着参与节点的增多,以及每秒需要处理的数据共享请求和应答的增多,已有的区块链技术被应用到数据分享和确权领域时,在分布式存储、共识协议、智能合约执行以及轻客户端查询方面面临的挑战以及改进的方向,以期为已有区块链系统应用于数据共享领域指明需要进一步突破的技术瓶颈。
关键词: 数据共享 ; 数据确权 ; 数据追溯 ; 区块链
论文引用格式:
张召,田继鑫,金澈清. 链上存证、链下传输的可信数据共享平台[J]. 大数据, 2020, 6(5): 106-117.
ZHANG Z, TIAN J X, JIN C Q. On-chain witness and off-chain transmission trustworthy data sharing platform[J]. Big Data Research, 2020, 6(5): 106-117.
1 引言
随着互联网技术的发展,以及数据和关键信息的采集、传输、存储和处理的自动化,越来越多的数据信息以电子资源的形式记录和存储,这些基础数据是企事业单位的核心数字资产,可以为各行各业的决策支持和精准营销奠定数据基础。然而,由于不同企业或者不同政府部门之间缺乏互信,鉴于数据泄露以及不正当使用的风险,以及企业之间或者政府部门之间行政利益的不同,很多数据拥有者不愿意共享数据,从而形成一个个数据孤岛,数据的价值无法得到应有的利用,对数据资源造成了极大的浪费。
1.1 数据共享模式
数据流通过程涉及的主体包括数据生产者、数据收集者、数据使用者、数据处理者和数据监管者等。为了打通业务流程,更大程度地发挥数据隐藏的价值,通过数据共享让数据流通起来是一个非常有效的方法。根据数据共享应用的业务场景,数据的共享模式可以分为如下3类。
(1)数据不离开私有域,通过授权实现远程访问共享
该模式下,基于某种业务逻辑,需要访问多个数据提供者的共享数据,其基本特点是按需共享。这一般属于协同业务,对于共享的数据,参与方一般预先签订授权或者法律法规授权,根据业务的需要,随时访问共享数据。如对新型冠状病毒肺炎确诊患者居家隔离的监控及活动轨迹的流控,授权机构可以通过随时访问授权用户的相关数据(如手机用户的移动轨迹、支付平台的消费地点、监控数据等)来实现。
(2)数据离开私有域,通过数据移动汇聚实现在汇聚点上的集中数据共享
该模式下,由多个数据提供方提供的数据经规范化处理、汇总、分析后,形成新的共享数据。比较典型的应用是征信平台,其从各类银行类金融机构、公共事业、保险公司、支付平台获取企业或个人的信贷信息、支付信息、交易信息,经过汇总、处理后形成企业或个人的信用信息,信用信息可供各类授权企业或个人访问,并作为业务的参考依据。
(3)数据离开私有域,并且所有权也随之发生转移,在此过程中需要对数据进行确权
共享数据交易是该模式的典型应用,其基础是数据确权,在确权的基础上,共享数据的某些权利发生转移,同时数据提供方获得经济利益。交易的进行需要双方或多方的认可,并且共享数据的获得方必须在合约规定的权限内使用共享数据。如果数据获得方需要将共享数据交易给其他第三方,必须得到原权利人的许可。
从以上3个典型的数据共享模式可以看到,在数据共享流通的过程中,为了避免数据隐私泄