可信数据空间建设方案
简介:国家数据局在《可信数据空间发展行动计划(2024—2028年)》(简称《计划》)中提出了建立可信数据空间的目的是为了高效地实现数据开放共享,然而并未提出具体的解决问题的方案。目前的《计划》只是一种需求,对可信数据空间的解释也不够详细、具体,一些人对可信数据空间也产生了误解。数据孤岛是全球数字化进程中面临的共同挑战,产生数据孤岛的原因在于现有软件理论体系有问题。可信数据空间是一种与当前的软件理论体系有着很大差异的新软件理论体系。本文对《计划》中的存在的一些问题进行了解读,也提出了可信数据空间建设方案,可实现全球统一的身份认证、全球范围内各种数据的互联互通(数据全球通)。【与建设可信数据空间相关的软件“数据全球通”的下载地址:https://download.csdn.net/download/fanmz0307/90659671?spm=1001.2014.3001.5501】
1.1国家提出了建设可信数据空间,然而未提出具体的建设方案
国家数据局的《计划》表明“可信数据空间”已是关系到国计民生的大事,然而《计划》只是提出了需求和目标,并未说明应该采取什么样的具体的建设方案。
1.1.1当前在可信数据空间方面存在的问题
上海数据集团有限公司副总裁李小山提出了当前在可信数据空间方面存在的问题:城市可信数据空间建设问题剖析与目标定位 当前,城市数据流通面临着一系列严峻的问题和挑战。一方面,数据供需之间存在严重脱节......数据互联互通效率低、成本高。数据处理和共享交换需要专业的技术服务,但目前缺乏统一的规范和标准,专业化的技术型和服务型主体尚未形成规模,使得数据产品标准化程度低,交付服务履约成本过高,导致数据生态组织之间的信任和协同机制未形成......数据在跨主体、跨领域流通中困难重重。
1.1.2在全球范围内,数据孤岛仍是不治之症!
可信数据空间问题就是典型的信息孤岛、数据孤岛问题,关键问题就是数据的供方与需方之间的数据流通不畅,犹如货物在供方与需方之间由运输工具问题而导致货物流通不畅。当前的“路(互联网、硬件)”是全球通畅的,然而“运输工具(软件和数据)有问题”,从而导致数据流通低效昂贵。
信息孤岛是20多年前就提出的问题,全球无数IT技术人员花费了巨大的精力提出了多种解决方案,然而,时至今日不但未能从根本上解决问题,信息孤岛问题反而更加严重。近几年的热门话题数据治理也是由于信息孤岛问题越来越严重而提出的,该如何才能治理,也没有大家认可的技术方案。
全球现有的各种信息系统百分之百是信息孤岛,无一例外!原因何在?其根本原因在于现有的软件理论体系有问题,属于孤岛型理论体系。正因如此,要建立真正的可信数据空间,必须以全新的软件理论体系为基础,若还是以现有的软件理论体系为基础,那么,其结果只会是产生更多的数据孤岛。
互联互通应该是犹如电子邮件那样,在全球范围内,任何人、各种软件系统,都可以通过互联网而实现各种数据的通信,然而,在目前的情况下,甲乙两个系统之间要实现数据通信,只有开发点对点的专用数据接口,此法的成本非常高,效率非常低。
当前的点对点数据接口是阻碍数据流通的关键。建立可信数据空间的重点应该是通过什么样的具体方法而解决数据孤岛问题从而实现高效的数据流通,因此,必须实现全球统一的通用的身份认证,也必须建立全球统一的通用的可以实现数据全球通的数据流通工具,这是解决数据孤岛问题的必要条件。
从理论上而言,利用现有技术可以通过转换数据结构的方式而实现任意两个软件系统之间的任意数据的互联互通、开放共享;由于全球的各种信息系统的数量超过千万,全球所产生的数据超过数万亿条,面对如此海量的异构的、不标准的数据,现有的点对点数据接口的方法实现数据流通所花的成本非常高、不可承受。因此,当前的信息孤岛只能在局部进行缓解,而不能整体上得到根治。利用现有技术设计信息系统时,每增加一个信息系统,就增加了一个孤岛。
两个系统之间的互联互通约需要1个人月的工程量;三个系统之间的互联互通约需要(3-1)*(3-2)=3个人月的工程量;四个系统之间的互联互通约需要(4-3)*(4-2)*(4-3)=6个人月的工程量;N个信息系统之间的互联互通约需要(N-1)*(N-2)*(N-3)*……*3*2*1个人月的工程量。
由上述公式可看出,随着信息系统的数据的增多,系统之间的互联互通的工程量十分巨大,无法承受。
结论:产生数据孤岛的根本原因在于现有软件理论体系有问题,是“以我为中心”的软件设计理论体系。提出可信数据空间的背景就是当前所面临的严重的数据孤岛问题。
推论:如果利用现有软件理论体系而建立可信数据空间,肯定还是数据孤岛,肯定再次陷入数据孤岛的死路。建立高效的可信数据空间需要新的软件理论体系。
1.2可信数据空间与现有的软件理论体系的差异
可信数据空间与当前的软件理论体系是两种不同的体系,利用当前的软件理论体系所设计的软件所处理的数据全都是软件系统之内的数据;可信数据空间所处理的数据是在众多的软件系统之间流通的数据,数据来源于很多个软件系统。
利用现有的软件理论体系所设计出的各种软件系统所处理的数据是“以我为中心”的软件系统之内的数据,软件系统只处理我的系统中的数据,我不识别处理你的数据,也不识别处理他的数据,因此称作是孤岛型系统。(因各软件系统只能识别处理自己所定义的数据,从软件系统外界而来的数据不是自己定义的,不能识别处理。)
可信数据空间的期望是:让数据在众多的软件系统之间高效流通,并识别处理众多的软件系统之间流通的数据;相关的数据包括“我的数据,你的数据,他的数据,大家的数据”。
当前的各种软件系统只能识别处理自己定义的数据,然而,可信数据空间所期望的是各种软件系统中的各种数据的传递、共享、存储、识别处理,这是现有的软件理论不可能实现的,或者说,需要创立新的软件理论体系才能满足可信数据空间的需求。
可信数据空间涉及到全球范围数十亿自然人、数千万以上的各种组织机构(法人)、数千万以上的各种信息系统、数百种语言、两百多个国家地区,不仅限于中国一个国家,这需要确保数据在任何人、任何法人、各种信息系统之间的各种数据都是可以高效传递、共享的,都是可信的。
为什么提出可信数据空间的概念?难道现有的数据不可信?当前的问题不是数据完全不可信,也不是数据不通,而是,当众多单位、众多人、众多的信息系统之间共享交换数据时出现了问题,各种信息系统之间共享交换数据时的效率非常低,成本非常高。
需要特别注意的是:如果还是以现有的软件理论体系建设可信数据空间,肯定会走入数据孤岛的死路!这是毫无疑问的,全球20多年的实践已证明了这一点。
1.2.1可信数据空间是什么?
《可信数据空间发展行动计划(2024—2028年)》对可信数据空间的定义: 可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。
可信数据空间是一个比较新的概念,很多人对其含义也是一知半解,《计划》对可信数据空间的相关解释非常概括,不够详细具体。
针对可信数据空间,很多人会产生如下疑问:
- 可信数据空间是什么?
- 可信数据是什么?
- 可信数据与当前的互联网中的数据有什么异同?
- 可信数据与个人电脑中的数据有什么异同?
- 实现数据资源共享共用的“一种数据流通利用基础设施”是什么?
下文通过例子来说明什么是可信数据空间:
在没有可信数据空间的情况下:
1、甲乙双方签订(纸质)采购合同。
2、甲方的ERP系统记录采购合同订单。
3、乙方的把甲方的采购合同订单录入自己的ERP系统。
在可信数据空间的支持下:
- 甲方利用ERP系统生成采购订单。
- 甲方利用可信数据空间把ERP系统生成采购订单发送给乙方。
- 乙方通过可信数据空间接收到甲方的采购订单。
- 乙方同意甲方的采购订单,并把确认后的采购订单发回给甲方。
- 甲方通过可信数据空间接收到乙方确认后的采购订单,甲乙双方的采购订单生效。
可信数据与数据的区别:
首先需要明确的是《计划》中的数据指的是计算机中的数据,而非书面上数据。在传统的IT行业,每台计算机上所存储的、每个软件系统所处理的都可以称作是数据,都是自己的数据。
可信数据则是数据供方与数据需方之间的数据。例如,甲乙双方的订单数据。
在传统的IT行业,没有数据与可信数据之分,全都称作是数据。在提出了可信数据空间之后,就有必要对数据与可信数据进行准确的定义。数据是个大概念,数据中包括可信数据与非可信数据,这犹如自己的笔记本上的文字都是自己的,契约方面的文字属于甲乙双方(或签约各方)的,因此,把可信数据称作是契约数据是非常合适的。
对于自己的计算机、自己的软件系统中的数据而言,只要自己认可就可以,只要在一台计算机上存储即可。对于可信数据而言,其表达、存储、传递、处理的方式就比个人电脑中的数据复杂很多,可信数据需要在供需双方的计算机上存储,也需要传递,还需要公证。处理可信数据的技术难度要远高于处理数据的技术难度。
可信数据涉及到全球范围数十亿自然人、数千万以上的各种组织机构(法人)、数千万以上的各种信息系统、数百种语言、两百多个国家地区,不仅限于中国一个国家,这需要确保数据在任何人、任何法人、各种信息系统之间的各种数据的传递、共享都是可信的。
当前的互联网已使得数据在全球范围内互联互通,然而,当前的互联网所传递的大多数数据都是匿名的、不是百分之百可信的,甚至是虚假的。在互联网上,谁都可以随意发布信息,谁也不用负责,信不信由你。我们可以通过互联网而共享交换数据,然而,现有的共享交换数据的方法不太可信。
互联网中的数据的特点:匿名、免费、无责任、信不信由你。
可信数据的特点一:可信数据空间中的可信数据是在数据流通的过程中才产生的。若数据未在供需双方流通,供方虽有数据,此数据也不是可信数据空间中的可信数据。例如,某机构有很多数据,此数据在向需方流通之前,这些数据不属于可信数据空间中的可信数据。
可信数据的特点二:实名、各负其责、有责有权、可信。可信数据中的可信指的是数据供需双方可信。
可信数据是:1、人(具有行为能的自然人、法人)与人(具有行为能的自然人、法人)之间的(契约)数据,数据供需双方都要承担相应的责任;2、数据需要在第三方公证机构公证、数据流通痕迹可追溯。(注:具有行为能力通常指自然人或法人能够理解自己的行为,并对自己的行为负责,通过自己的行为享受权利和履行义务的资格。)
可信数据的定义:可信数据是人(具有行为能的自然人、法人)与人(具有行为能的自然人、法人)之间的(契约)数据,数据供需双方都要承担与数据相应的责任;可信数据是“有确定的数据,有确定的数据提供者,有确定的数据接收者,有数据流通痕迹,数据流通痕迹在第三方公证、不可篡改、可追溯”的数据。
在互联网上传递数据时所强调的是可靠性;可信数据的传递所强调的是可信性(也包括可靠性)。
可信数据空间:可信数据空间是确保数据在数据供需双方高效流通、也确保数据及数据流通痕迹在第三方公证、可追溯、不可篡改的(软件、硬件)工具、方法。
在目前的情况下,可信数据空间应该是以互联网为基础而建立的,建立在局域网内的数据空间不能称作是可信数据空间。
综上所述,可信数据空间是确保数据在数据供需双方高效流通、也确保数据及数据流通痕迹在第三方公证、可追溯、不可篡改的(软件、硬件)工具、方法。可信数据是数据供需双方利用可信数据空间而流通的数据。未利用可信数据空间这种设施流通的数据不能称作是可信数据。
全球统一的身份认证及全球统一通用的数据流通工具是建立可信数据空间的基础。当前之所以在全球范围内存在严重的数据孤岛、信息孤岛问题,其根本原因就在于当前的各种信息系统各自建立自己独立的身份认证系统,且各不兼容,没有全球统一的、通用的数据流通工具,只是通过各自开发专用的点对点数据接口而实现数据共享交换。
1.2.2在可信数据空间建设中必须遵守如下的准则
在可信数据空间建设中必须遵守如下准则:
- 必须采用全球统一的身份认证。切忌各自独立地建立身份认证系统,全球可有多个身份认证系统,但都必须以用户的真实身份为基础。必须采用全球统一的数据流通工具(通用的数据接口)(犹如电子邮件可以全球通的数据流通工具)。全球可有多个数据流通工具,但,必须相互兼容;切忌各处独立。
- 数据供需双方必须是实名的。有明确的责任方为数据承担相应的法律责任的数据才是可信数据。数据提供方必须对其所提供的数据承担相应的法律责任。谁提供数据谁承担责任。谁提供数据谁控制数据的权限。数据需方、数据接收方必须接受数据供方所要求的保密义务;数据接收方须经数据供方授权才能向其它人提供、公开所接收到的数据,谁使用数据谁承担责任。(可信数据空间中的数据与当前的互联网上盛行的匿名数据具有本质的不同。匿名数据是不可信的,或者说匿名数据是否真实,由数据的接收者自己判断,数据的提供方不为数据的真实性承担责任。)
- 数据流通痕迹必须是可追溯的,数据在第三方进行记录、公证。
- 第三方数据服务机构只有经数据供需双方约定的授权之后才能向有关的人和机构提供数据流通痕迹,不能随意向数据供需双方之外的人提供数据流通痕迹(这犹如邮局不得拆阅其所邮寄的信件)。
- 数据监管方事前制订“标准、规范、规则、法律、法规”,事中不参与,事后有纠纷时处理纠纷。(各省市的政府机构只控制管辖范围内的政府机构的数据。但,也须坚持谁审批,谁提供数据,谁承担责任,即使是上级单位也不为下级单位承担责任。上级单位只负责事前制订政策(例如制订什么数据必须共享、向谁共享,什么数据不共享),事中不参与、事后监督。)
- 数据供方如何提供数据,由数据供方决定;数据需方接收到数据如何识别处理数据,由数据需方决定;或可信数据空间只负责原样传输数据,不负责数据的解读。数据监管方只负责制订有关标准、规范、规则,数据供需双方是否执行相关标准、规范、规则,由自己决定。
- 可信数据空间须以互联网为基础、全球开放。(目的是为了全球互联互通,避免产生数据孤岛。不以互联网为基础的数据空间都不是可信数据空间。这也是为了排除建立专用的与互联网隔离的局域网络内部的可信数据空间(例如与互联物物理隔离的公安网)。)
1.3利用契约数据流通系统集群建立可信数据空间
可信数据空间应该长啥样?目前没有大家公认的技术方案,从理论上而言可以用多种方法建立很多种可信数据空间。目前的互联网已可实现数据的全球互联互通,因此,当前的硬件没问题,可以满足实现可信数据空间的条件;目前之所以存在非常严重的数据孤岛问题,关键是当前的软件系统和数据有问题,因此,只要对当前的软件系统和数据存在的问题进行改造,即可建立可信数据空间。
下文提出了一种以“契约数据流通系统集群”为基础而建立可信数据空间的技术方案。【有关契约数据流通系统集群的详细内容详见:https://blog.csdn.net/fanmz0307/article/details/128867623?spm=1001.2014.3001.5502】【与建设可信数据空间相关的软件“数据全球通”的下载地址:https://download.csdn.net/download/fanmz0307/90659671?spm=1001.2014.3001.5501】
契约数据流通系统集群是一种通用的结构化数据传输工具,可以在全球范围内,在任何人(自然人、法人)、各种信息系统之间实现各种结构化数据的传输,可以实现全球统一的身份认证,在全球范围内可实现单帐号(同一个帐号)登录各种开放型信息系统。契约数据流通系统集群在实现信息系统之间的数据互联互通、开放共享时,不需要数据接口,各信息系统之间也不是直接互联互通,各信息系统通过契约数据流通系统集群这个第三方而间接地互联互通(无接口通信)。以契约数据流通系统集群为基础可以方便地建立可信数据空间。
1.3.1契约数据流通系统集群实现数据全球通的原理
无接口通信的原理:数据发送方的数据流通系统(简称数据通)对结构化数据进行特殊的编码后使结构化数据转化为XML文件,然后把XML文件作为电子邮件的附件而传输数据;数据接收方的数据通从电子邮件中获得XML文件,数据通把XML文件进行特殊的解码后把结构化数据存储到接收方的本地数据库中,数据接收方可以从自己的数据库中直接查询到所接收到的各种数据而不需要开发专用的数据接口。数据通以电子邮件作为结构化数据传输的通信工具,因此,数据通可以在全球范围内,在任何人(自然人、法人)、各种信息系统之间实现各种结构化数据的传输,可以大幅度降低数据共享交换的成本。
利用契约数据流通系统集群建立可信数据空间时,可信数据空间中的数据由数据供方提供,第三方数据服务方仅提供身份认证服务、数据流通系统(数据流通工具)、保存数据流通痕迹。
1.3.2可信数据空间结构图
图4 可信数据空间结构图
在上图中,可信数据空间由四方组成:数据供方、数据需方、第三方数据服务方(公证方)、国家(国际)监督管理机构(可由各个国家的监督管理机构所组成)。(从理论上而言,可信数据空间涉及到全球范围数十亿自然人、数千万以上的各种组织机构(法人)、数千万以上的各种信息系统、数百种语言、两百多个国家地区,不仅限于某个国家,这需要确保数据在任何人、任何法人、各种信息系统之间的各种数据的传递、共享都是可信的。)
全球的自然人和法人都可以是数据供方,也可以是数据需方。
第三方数据服务机构(公证方)在全球范围内可有多个。可信数据空间中的身份认证及数据流通工具由第三方数据服务机构提供。第三方数据服务机构由具有公证资质的机构承担;第三方数据服务机构负责记录数据流通痕迹。
可信数据空间的最佳方案是利用全球统一的、标准的方法而建立。因目前没有大家公认的技术、工具、方法,初期会有利用多种方法而建立的可信数据空间。
可信数据空间应是建立在互联网上的(不能建在局域网内)。
有关可信数据空间的问题:当前的互联网已可全球通,这表明,当前的硬件没问题,当前的问题只是数据不能高效地全球通,问题的根源在于软件系统及数据。可信数据空间是一种通过对软件和数据进行创新的一种新技术、新工具、新方法。
在数据流通中,发送什么样的数据、发送多少、如何识别处理数据,由数据供需双方约定;可信数据空间、第三方数据流通机构只负责原样传递数据,并记录数据流通痕迹。
1.3.3可信数据空间建设分为两个阶段
当前的互联网,百花齐放,只有数据,没有可信,或者说属于信不信由你的数据。建立可信数据空间须解决三大问题:全球统一的、标准的、通用的“身份认证、数据流通工具、数据识别”。
可信数据空间建设分两个阶段:第一阶段是实现全球统一的标准的身份认证、全球统一的标准的数据接口,这需要对现有的各种信息系统进行局部的、少量的升级改造;第二阶段是在第一阶段的基础上再实现全球统一的、标准的数据识别,这需要对现有的各种信息系统及其数据进行全面的升级改造。
利用契约数据流通系统集群即可很容地实现可信数据空间第一阶段的建设。
要实现可信数据空间第二阶段的建设,工程量非常庞大,需要采用新的软件理论体系对现有的各种软件系统进行升级改造,也需要十年以上的时间。
1.4契约数据流通系统集群
1.4.1背景技术
信息孤岛问题是大数据时代面临的一大问题,在解决信息孤岛问题实现数据开放共享、互联互通的过程中,数据在不同的地方的流通是其中必不可少的关键环节,因此,非常有必要设计出一种全球通用的、统一的、使用方便的、廉价的结构化数据流通工具,这种工具可以在全球范围内实现各种信息系统之间、各种信息系统与各国的人之间的任何结构化数据的流通,现有技术中没这样的结构化数据流通工具。
现有技术实现数据流通的主要方法有两种,一是利用电子邮件,二是利用点对点数据连接方式。问题是电子邮件只是通过匿名的方式实现非结构化数据的流通,不适合传递结构化数据,电子邮件也可以通过XML文件传递结构化数据,然而不懂计算机技术的普通用户无法处理、识别XML文件中的结构化数据,因此,只是专业技术人员偶尔使用电子邮件传递结构化数据;点对点数据连接方式虽说可以传输各种数据,但这种连接方式只是专用的数据连接方式,不通用,成本非常高。在现有技术中,人们主要利用API、Web Services技术通过数据交换平台、点对点这种专用的双方直接联通的数据连接方式而实现数据共享交换。
数据交换平台是指将分散建设的若干应用信息系统进行整合,通过计算机网络构建的信息交换平台,它使若干个应用子系统进行数据的传输及共享,保证分布异构系统之间互联互通,建立中心数据库,完成数据的抽取、集中、加载、展现,构造统一的数据处理和交换。数据交换平台都是专用的,不是通用的,这些平台的应用范围只是一家企业、一个城市的某个局的某个系统与其下属单位之间数据交换;即各个数据交换平台都有其特定的应用范围,只是针对数量非常有限有若干个应用系统,针对不同范围的应用必须开发不同的数据交换平台,而无法利用一种通用的数据交换平台而实现全球数千万个以上的各种信息系统、数十亿以上的用户之间的数据交换。
目前的数据交换平台不能成为通用的数据交换平台的主要原因有三个:1、API、Web Services技术天生的就是两系统之间直接互联的点对点技术,不可能利用API、Web Services技术而编写出通用的数据交换平台。2、当前数据平台所完成功能是“数据的抽取、集中、加载、展现”;由于当前的各种信息系统中的结构化数据属于“多源、异构”的,要完成“数据的抽取(ETL)”,就必须针对不同的信息系统而设计专用的软件,用现有技术不可能设计出通用的“数据的抽取(ETL)”软件。3、目前没有全球统一的用户身份认证、识别技术,也没有全球统一的信息系统权限管理及用户管理技术,不同的信息系统各自采用不同信息系统权限管理及用户管理方法。
API、Web Services技术的特点是:API、Web Services有提供方及调用方,提供方根据自己的系统的特点而提供相应的服务,调用方通过调用提供方的API、Web Services而完成相应的数据交换。由于不同的信息系统拥有不同的结构化数据,因此不同的系统必须通过不同的API、Web Services而完成不同的数据交换,即不同的系统不可能通过相同的API、Web Services而完成不同的数据交换,这也导致现有的API、Web Services技术不能编写出通用的数据交换平台,正因如此,API、Web Services技术天生的就是点对点技术。
API、Web Services技术在诞生之初就只是为了甲乙双方之间(或一方对多方)完成某种功能而未考虑“通用”的问题,“通用”的数据流通系统所实现的不仅仅是甲乙双方之间数据流通,也包括全球范围内的各种信息系统之间、任何人之间的数据流通。以API、Web Services技术而开发的点对点数据连接方式实现数据流通时需要配置服务器、操作系统、数据库,也要防攻击、防病毒、防篡改,还要开发专用的应用软件,相应的成本少则5万元左右,多则超过百万元。
现有技术(例如数据交换平台)的一个非常关键的问题就是把数据流通与数据治理当作一件事来处理。只有把数据流通与数据治理分开当作两件独立的事件,把数据流通当作一项单独的事件来处理才可能编写出通用的数据流通工具。现有的各种信息系统之所以称作是信息孤岛,一个根本原因在于现有信息系统只是在自己的系统中存贮处理数据,而不能把相关数据发送给用户,使用户也可以存贮、查询数据,例如,电子商务、水费、电费、银行流水、房产交易数据,及用户登录使用各种信息系统而产生的各种数据及这些数据流通的痕迹,这些数据也应该发送给用户,让用户也可以存贮、查询这些数据。
EDI、SWIFT是专用的数据流通工具,不是通用的工具,不能实现各行各业的结构化数据流通。
契约是指双方或多方共同协议订立的有关买卖、抵押、租赁等关系的文书。契约数据流通系统集群对契约数据的定义:契约数据与传统的契约相似,契约数据是指双方或多方共同协议订立的有关买卖、抵押、租赁等关系的结构化数据。契约数据的典型应用场景:A医院使用B医院的有关患者X的化验单数据,相关的问题是出现医疗事故时,如何鉴定各方的责任;买家通过第三方的电子商务平台下单购买商品;这两种数据即可称作是契约数据。
在契约数据流通中,如何表达及识别甲乙双方的身份也是一个大问题,只有当数据接收方可以方便地识别出数据的发送者是谁,相应的契约数据流通工具才是合格的;当前的问题是契约数据流通涉及到全球范围内的数千万个以上的各种信息系统、数十亿以上的用户,现有技术未能实现对全球用户身份进行统一识别,也没有一种简单通用的识别收发数据双方身份的方法。
TCP/IP协议是针对设备之间进行通信的协议,因此这种通信可称为设备通信。由于各种信息系统之间的通信中含有人的因素,因此这种通信可称作人类通信。契约数据流通系统集群引入人类通信、设备通信的概念是为了说明通信分为两大类,各有特点,两者之间有本质差异。信息孤岛问题、数据开放共享问题是人类通信中的问题,问题的根本原因在于当前的以TCP/IP为基础的通信是设备通信,TCP/IP协议中未包括与人相关的内容,不适合人类通信,或者说现有的通信技术不能全面解决人类通信中出现的新问题。人类通信与设备通信之间的本质差异在于设备通信是以匿名的非结构化数据为主,人类通信是以实名的结构化数据为主,人类通信涉及到数权,也涉及到多源异构问题。
在法律上,有物权法,对于数据而言,数据也有责、权、利,简称数权。数权也包括是否有权获得数据、对数据承担的责任和义务。设备通信中未涉及数权问题,设备通信关注的重点是可靠性,即如何使数据在传输中不丢失数据,TCP/IP协议中也没有与数权相关的内容。对设备通信而言,我发送数据,你接收到了数据,就OK了,你我之间没有责权利问题。人类通信关注的重点不仅是可靠,更关注数据的可信,即如何确保数据是可以信任的。数据的可信包括:谁发送的数据、谁对数据承担责任,以及数据流通痕迹的可追溯不可篡改。TCP/IP协议中未包含数据可信方面的内容。在数据流通中,数权是收发数据双方对数据的责任和权利。数权是数据流通中必须解决的问题,契约数据流通系统集群强调收发数据双方以实名为基础就是为了解决数权相关的问题,数据的发送者必须为所发送的数据承担相应的法律责任。
设备通信是以通信协议为基础,以通用的通信工具而进行通信,例如,浏览器、FTP软件、电子邮件就是设备通信中通用的通信工具。现有技术可以实现人类通信,只是通信方式落后,低效昂贵。以信息系统(其拥有者是法人)之间的通信为例,信息系统是通过用户管理、信息系统权限管理、各个信息系统通过开发专用的点对点式的、两系统之间直接连接的数据接口而实现人与人之间的人类通信。能否设计出犹如浏览器、FTP软件、电子邮件这样的通用的人类通信工具软件?现有技术中没有这样通用的工具软件。契约数据流通系统集群的目的就是为了设计出通用的人类通信工具软件以及人类通信协议。
综上所述,利用现有技术,可以用很多方法实现结构化数据的流通,然而,全部都是通过开发专用的点对点这种使通信双方直接互联的数据连接方式实现结构化数据流通,低效昂贵,人们并不满意。
1.4.2相关内容
在契约数据流通系统集群中,数据流通指的是不同信息系统、不同人(自然人、法人)之间的结构化数据的流通,同一系统之中的各用户之间的数据流通不属于契约数据流通系统集群的范围。契约数据流通系统集群所解决的与数据流通相关的共性问题主要有4个:1、数权(用户身份、信息系统权限、数据的责任);2、流通(数据流通及痕迹);3、结构(多源异构数据的存贮查询);4、可信(数据的可信)。
1、数权(用户身份、系统权限、数据的责任)问题:现有的各个信息系统都有自己专用的的用户管理方法和系统权限管理方法。用户要登录某个系统,就必须在登录系统之前首先注册用户,然后再根据用户名和密码登录系统。由于全球的信息系统太多,谁也不可能全部记住曾经使用过的系统的用户名和密码。注册一个用户约需要十分钟,每个人一年要在多个系统中注册用户;一个人一年,在注册用户、遗忘用户名和密码的找回密码方面需要花几个小时的时间。对于全球数十亿用户而言,如果实现了全球统一的用户身份认证管理及信息系统权限管理,由此全球用户每年减少数百亿小时注册用户、遗忘用户名和密码的时间。由于各个信息系统的用户身份认证管理方法各不相同,当全球范围内的数千万个以上的各种信息系统之间共享交换数据时,也会产生各个系统之间不能识别对方的用户身份的问题,数据的接收方不知道是谁发送的数据也就不可能信任接收到的数据。契约数据流通系统集群之所以提出契约数据的概念,就是期望在不同的信息系统、不同的人(自然人、法人)之间流通的数据都能成为契约,而成为契约的首要条件就是数据接收者可以准确地了解是谁发送的数据,谁对数据承担责任,也只有知道了是谁发的数据才会成为可信的数据。信息系统中的数据其实是信息系统的拥有者(法人)的数据,由法人承担相应的责任。对于契约数据而言,当系统A把数据发送给系统B时,系统B必须通过某种方法而自动识别出系统A的法人是谁,然而现有技术未做到这一点。现有技术是通过点对点的方式交换数据,双方在事前已知对方是谁,因此,基本上不涉及用户身份识别问题。当前的单点登录及统一身份认证只是针对指定的某个单位、某个地方的有限的若干个系统,而不是全球的各种信息系统。不同的单点登录及统一身份认证系统也各自拥有各自的特点,不同国家、不同地区的单点登录、统一身份认证系统之间也不能相互认证。例如,A省的与B省的统一身份认证系统之间就不能互联互通。当全球范围内的数千万个信息系统之间共享交换数据时,需要有一种全球统一的、通用的用户身份认证、识别及信息系统权限管理方法。
2、流通(数据流通及痕迹):契约数据应该象合同一样,合同双方都有合同原件,收发契约数据的双方也应该都保留契约数据流通的痕迹,这样才能形成具有法律效力的完整的证据链,使得事后可以全面追溯数据流通的轨迹。目前的各种信息系统,例如电子政务、电子商务中的数据都是都只是单方保留数据流通的痕迹,而未把数据发送给普通用户,目前也没有可供普通用户保存、查询、阅读这些结构化数据的通用的工具。
3、结构(多源异构数据的存贮查询):由于大多数信息系统都是采用关系数据库存贮数据,而这些数据都存在多源异构的问题,当数据的接收方到大量的多源异构数据后,数据的存贮查询的代价非常高。
4、可信(数据的可信):数据的可信包括收发数据双方的身份的可信、收发数据的载体的可信、提供数据流通服务的机构的可信、可追溯不可篡改的数据流通痕迹,使数据流通过程成为具有法律效力的完整证据链。
契约数据流通系统集群的有益效果体现在:1、用户一次注册身份数据即可登录各种以契约数据流通系统集群为基础而设计的各种开放型系统,开放型系统根据用户的真实身份数据而为用户分配相应的使用权限,利用契约数据流通系统集群可实现全球统一的用户身份认证及信息系统权限管理,实现单帐号登录各种开放型系统;2、只要可以收发电子邮件,众多的信息系统、众多的人(自然人、法人)之间借助于通用的契约数据流通系统(简称数据通)即可实现各种结构化数据的互联互通,各信息系统不必开发专用的点对点式的数据连接方式的数据接口,也不必配置前置机;这是因为契约数据流通系统集群是利用数据通而间接地使两系统之间通信,而不是通过数据接口这种直接通信的方式;3、使数据流通痕迹成为可信、可追溯的、不可篡改的、法律上认可的完整的证据链;4、契约数据流通系统集群是一种通用的、使用方便的数据流通工具,可以实现跨层级、跨地域、跨系统、跨部门、跨业务的结构化数据流通,大幅度降低数据流通成本。
契约数据流通系统集群由实名邮件注册管理系统及若干个以同一标准而开发的契约数据流通系统和若干个以同一标准而开发的开放型系统组成;实名邮件注册管理系统包括各个国家的实名邮件注册管理系统和国际实名邮件注册管理系统;各个国家的实名邮件注册管理系统用于以对本国的实名电子邮件系统进行注册;国际实名邮件注册管理系统汇总了各个国家的实名邮件注册管理系统中已注册的实名电子邮件系统;契约数据流通系统由用户身份管理系统、实名邮件系统、发送数据系统、接收数据系统、数据处理系统、浏览数据系统组成。
用户身份管理系统包括用户身份注册模块、用户身份审核模块、系统初始化模块、用户身份查询模块;用户身份管理系统通过以下步骤实现用户身份的注册、审核、系统初始化:步骤a、用户通过用户身份注册模块注册身份数据;步骤b、数据流通服务机构通过用户身份审核模块审核用户身份数据;步骤c、用户身份数据审核合格后数据流通服务机构为用户建立使用契约数据流通系统的帐号,为用户颁发实名邮件地址;步骤d、用户身份管理系统调用系统初始化模块,为用户建立一个数据发件箱和一个数据收件箱;数据发件箱在关系数据库中是以一张表的形式存贮数据,用户已发送的所有结构化数据都存贮到这一张表中;数据收件箱在关系数据库中是以一张表的形式存贮数据,用户所接收到的所有结构化数据都存贮到这一张表中。用户身份管理系统的用户身份查询模块查询用户身份的步骤:步骤a、用户A利用契约数据流通系统向用户B所用的契约数据流通系统的指定的实名邮件地址发送查询用户B的身份的查询请求;步骤b、用户B所用的契约数据流通系统接收到用户A的请求后把查询请求转发给用户B;步骤c、用户B若同意向用户A提供身份数据,则回复表示同意提供身份数据;步骤d、用户身份管理系统中的用户身份查询模块根据用户B的回复意见把用户B的身份数据发送给用户A;
发送数据系统以实名邮件系统作为发送数据的载体,按如下步骤发送结构化数据:步骤a、接收用户输入的“发件人实名邮件地址、收件人实名邮件地址、邮件标题、邮件内容”,发送数据系统把将要发送的结构化数据及数据发送者身份数据转换为XML文件,并把XML文件作为邮件附件添加到电子邮件中;数据发送者身份数据是由数据发送者设置的,可以是数据发送者所设定的若干条身份数据;数据发送者身份数据由契约数据流通系统根据用户身份管理系统中的用户身份数据而由发送数据系统自动生成,不是由用户自己添加的;若在发送结构化数据的同时还要发送其它附件,则把相应的附件当作电子邮件的附件;在把将要发送的结构化数据转换为以XML文件的同时,发送数据系统获取所要发送的结构化数据的数据结构的编码,并把该编码与邮件内容合并在一起,两者之间以特殊字符分开;步骤b:在发送数据之前,契约数据流通系统首先判断相应的接收数据的电子邮件地址是不是实名电子邮件地址,判断方法是该电子邮件地址是否已在实名邮件注册管理系统中注册,若该电子邮件地址已在实名邮件注册管理系统中注册,则向该电子邮件地址发送数据,否则不向该电子邮件地址发送数据,并提示用户;步骤c、发送已编写好的电子邮件,即发送数据;步骤d、发送数据系统调用数据处理系统把已发送的结构化数据存贮到数据发件箱,若邮件中含有附件则把附件存贮到指定的文件夹之中的子文件夹,同一邮件中的所有附件存贮到同一个子文件夹中,不同的邮件中的附件存贮于不同的子文件夹中。
接收数据系统通过如下步骤接收、存贮数据:步骤a、在接收之前需要判断相应的电子邮件是不是实名邮件,若是则接收,若不是则不接收并提醒用户;步骤b、接收邮件中的数据;步骤c、把接收到的邮件的附件存贮到指定的文件夹,该文件夹由契约数据流通系统自动为每个用户建立,不同用户的数据存入不同的文件夹;接收数据系统所接收的每一个邮件中所有附件全部存入同一个子文件夹,不同邮件的附件存入不同的子文件夹;步骤d、调用数据处理系统处理接收到的数据,把数据以数据集装箱的结构形式存入数据收件箱。
发送数据时数据处理系统处理数据的步骤:步骤a、数据处理系统把邮件中的数据“邮件地址、发件人、邮件标题、邮件内容”、用户身份数据、数据流通状态、已发送的结构化数据转换到数据集装箱中;步骤b、把数据集装箱中的数据存入数据发件箱。
接收数据时数据处理系统处理数据的步骤:步骤a、从邮件内容中截取与数据结构相关的编码;步骤b、根据数据编码把接收到的XML文件解码成结构化数据;步骤c、把“发件人邮件地址、邮件标题、邮件内容”、数据流通状态及解码后的结构化数据存入数据集装箱;步骤d、把数据集装箱中的数据存入数据收件箱中。
数据收件箱、数据发件箱中的数据都是以数据集装箱的形式存贮数据,同一封邮件中的全部结构化数据全部存贮到同一个数据集装箱中,不同的邮件中的数据存贮到不同的数据集装箱中;数据处理系统把不同的用户所接收到的数据存入不同的表中,同一个用户所接收到的各种数据全部存入同一张表中;数据集装箱的数据内容由“数据流通封面、数据发者身份数据、数据流通状态、数据内容”4个组成部分,同一数据集装箱中的数据全部存入同一张表中;数据发件箱中的数据流通封面中的数据包括数据集装箱编号、收件人、收件人实名邮件地址、邮件标题、邮件内容,其中的数据集装箱编号可设置为发件流水号;数据收件中数据流通封面中的数据包括数据集装箱编号、发件人、发件人实名邮件地址、邮件标题、邮件内容,其中的数据集装箱编号可设置为收件流水号;数据发送者身份数据由发送者自己设置,发送者可设置给对方提供哪些身份数据,身份数据的数据内容是由契约数据流通系统根据用户身份管理系统中的用户身份数据而生成的,不是由发送者填写的;数据流通状态由数据流通系统根据收发数据的状态而自动生成;数据集装箱中可含有子数据集装箱,子数据集装箱中还可以含有子数据集装箱,即数据集装箱可以嵌套;每一个数据集装箱都有一个唯一的编号,不同的数据集装箱不能拥有相同的编号,具有相同的集装箱编号的数据为同一集装箱中的数据;每一个子数据集装箱都有一个唯一的编号,不同的子集装箱有不同的编号;数据集装箱中的数据内容为契约数据流通系统收发的结构化数据;
开放型系统是以契约数据流通集群为基础而建立的信息系统,主要内容包括用户管理、信息系统权限管理、用户与系统之间的数据流通;开放型系统以两种方式实现用户登录系统并实现“一次注册用户全球通用”的“单帐号登录”的用户管理的方法:第一种是以“实名邮件地址+密码”的方式登录开放型系统,相应步骤是:步骤a1.1、用户X在第一次登录某个开放型系统时,在系统中输入自己的实名邮件地址及自己设定的密码,然后点击登录系统;步骤a1.2、开放型系统判断用户X是不是第一次登录系统,若用户X是第一次登录开放型系统,则开放型系统通过用户身份管理系统获得用户身份数据;步骤a1.3、开放型系统接收到用户X的身份数据后根据用户X的身份数据而为用户X分配使用系统的相应的权限,并记录用户的身份数据;开放型系统记录用户X设定的“实名邮件地址+密码”的登录系统的帐号并允许用户X登录系统;步骤b1.1、若用户已登录过开放型系统,用户X可用“实名邮件地址+密码”方式而登录系统;第二种是以“只要实名邮件地址,不用密码登录系统”的方式登录开放型系统,相应的步骤是:步骤a1.1、用户X在登录某个开放型系统时输入自己的实名邮件地址;步骤b1.1、开放型系统判断用户X是不是第一次登录系统,若用户X是第一次登录开放型系统,则开放型系统通过用户身份管理系统获得用户身份数据:步骤b1.2、开放型系统接收到用户X的身份数据后根据用户X的身份数据而为用户X分配使用系统的相应的权限,并记录用户的身份数据;步骤b1.3、开放型系统把用户登录系统的链接发送到用户X的契约数据流通系统;步骤b1.4、用户X在自己的契约数据流通系统中点击链接地址即可登录开放型系统;步骤b2.1、若用户已登录过开放型系统,开放型系统根据已记录的用户身份数据而直接把用户登录系统的链接发送到用户X的契约数据流通系统;步骤b2.2、用户X在自己的契约数据流通系统中点击链接地址即可登录开放型系统。
开放型系统的系统权限管理的设计步骤:步骤a、根据用户的身份数据而为用户分配使用系统的角色;步骤b、根据用户的角色而为用户分配使用系统的权限。开放型系统与系统用户之间的数据交换、使双方都能保留数据流通痕迹按以下步骤来实现:步骤a、开放型系统通过契约数据流通系统而把用户录入的数据,或系统产生的与用户相关的数据,发送给用户;步骤b、用户在自己的契约数据流通系统中对数据进行核对;步骤c、用户对数据核对无误后给开放型系统回复确认;步骤d、开放型系统根据用户回复的意见而处理用户录入的数据,或处理系统产生的与用户相关的数据;
数据流通系统分为契约数据流通系统、匿名数据流通系统、内部数据流通系统;匿名数据流通系统及内部数据流通系统是以“非实名电子邮件系统”为基础的数据流通系统,内部数据流通系统是以机构内部网络为基础的数据流通系统;契约数据流通系统与“匿名数据流通系统、内部数据流通系统”之间相隔离,不能相互收发数据。
契约数据流通系统集群通过第三方机构而实现数据可信;第三方机构包括数据流通协会及数据流通服务机构;数据流通协会包括各个国家的数据流通协会及国际数据流通协会,国际数据流通协会由各个国家的数据流通协会组成,各个国家的数据流通协会是经各国审核而成立的合法的可信机构;各个国家的实名邮件注册管理系统由各个国家的数据流通协会负责管理;实名邮件注册管理系统用于管理实名邮件系统的注册,实名邮件系统由数据流通服务机构提供;国家数据流通协会负责审核数据流通服务机构的资质、资格,审核合格后把数据流通服务机构的实名邮件系统域名录入到实名邮件注册管理系统;国际实名邮件注册管理系统由国际数据流通协会负责管理,国际数据流通协会负责汇总在各国的实名邮件注册管理系统注册的实名电子邮件系统;数据流通服务机构利用契约数据流通系统为用户提供服务。
契约数据流通系统直接把相关的结构化数据发送给数据需求方即可实现推式数据通信;契约数据流通系统可以通过推式数据通信而实现拉式数据通信,拉式数据通信按如下步骤实现:步骤a、数据需求方通过契约数据流通系统向数据提供方发送查询处理数据的参数,该参数的格式由数据的提供方设定,参数存贮在二维的表中即可,数据需求方只要按数据的提供方设定的格式输入查询参数即可;步骤b、数据提供方从契约数据流通系统中接收数据;步骤c、数据提供方根据数据需求方的身份判断数据需求方是否具有查询处理数据的资格、权限,若有查询处理数据的资格、权限,则执行一步的查询处理数据操作;步骤d、数据提供方判断查询参数是否符合要求,若参数合格则根据参数而执行相应的功能;若参数不合格则通过契约数据流通系统回复数据需求方,告诉数据需求方参数不合格;步骤e、数据提供方根据接收到的参数查询处理数据;步骤f、数据提供方利用契约数据流通系统把查询处理结果发回给数据需求方;步骤g、数据需求方从契约数据流通系统中获得查询处理结果。
契约数据流通系统通过以下步骤即可实现不同单位之间的协同审批:步骤a、用户A通过契约数据流通系统把数据发送给用户B;步骤b、用户B通过契约数据流通系统接收数据;步骤c、用户B对数据进行编辑并加上自己的意见;步骤d、用户B通过契约数据流通系统把编辑后的数据发回给用户A;步骤e、用户A通过契约数据流通系统接收用户B发送的数据。
契约数据流通系统的数据浏览系统可以两种方式展示接收到的数据,一是以数据集装箱的结构方式展示给用户;二是把数据集装箱中的数据转换为若干张二维表方式展示给用户,二维表中的数据存贮在DataSet中。
按同一标准而开发的若干个契约数据流通系统及若干个开放型系统所组成的集群是同一个集群,相应的契约数据流通系统之间可以实现互联互通,相应的开放型系统可以实现单帐号登录;契约数据流通系统的标准化设计方法包括:用户身份管理系统、发送数据系统、接收数据系统、数据处理系统、浏览数据系统的标准化,需要标准化的内容为“用户身份注册数据的数据结构及数据内容、数据集装箱、发送数据的编码、接收数据的解码”;开放型系统的标准化设计方法包括:开放型系统的统一的单帐号登录系统必须以“登录帐号、身份认证、身份注册、权限管理”的统一化和标准化为基础,即“统一采用‘实名邮件地址+密码’,或‘只有实名邮件地址,不需要密码’的用户帐号管理方式”;统一根据用户身份管理系统中的用户真实身份数据而进行用户身份认证;用户身份管理系统中的用户身份数据的数据结构和数据内容必须标准化统一化,统一根据用户真实身份数据而为用户分配系统使用权限。
1.4.3附图说明
1.4.4具体实施方式
契约数据流通系统集群的思路是设计出一种犹如轮船一样的通用的运输工具,各种货物(数据)都装到集装箱中,然后再把货物(数据)放到轮船上运输到世界各地。由于现有技术中没有通用的结构化数据流通工具,具体到通用的结构化数据流通工具该长啥样、该实现哪些功能、该如何实现,还不清楚,也无章可循。
在初始阶段,想通过API、Web Services技术来编写通用结构化数据接口,然而经过多年的探索才认识到API、Web Services技术只能开发出点对点式的专用数据连接方式,无法开发出通用的数据接口。
是否可以让电子邮件成为结构化数据的载体来实现结构化数据在全球范围内的流通?经过长期试验,此方法是可行的。契约数据流通系统集群把结构化数据转化为XML文件作为电子邮件的附件而传递,问题的关键在于如何对结构化数据进行编码解码,以及如何对接收到的数据进行存贮查询处理。
数据通是在接收数据后的数据解码阶段才用到数据集装箱,或者在发送数据之前的编码阶段把数据存入数据发件箱时用到数据集装箱,而不是在运输过程中使用数据集装箱。数据通在实现数据传输过程中,结构化数据是通过电子邮件以XML文件的形式再加上编码数据而进行传递。数据通利用了电子邮件可以实现全球通的特性,电子邮件只是传输工具,数据的编码解码、存贮、查询由数据通完成。由于结构化数据非常复杂,在发送结构化数据的同时也要把有关结构化数据的结构的编码当作电子邮件的一部分发送给数据的接收方,数据的接收方通过解码邮件中的XML文件而获得相应的结构化数据。契约数据流通系统集群利用数据集装箱解决了结构化数据在流通过程所存在的多源异构的问题,每一次数据流通中的所有数据都存贮到一个集装箱中,图2为契约数据流通示意图。
数据通传输数据过程参考“图2数据流通示意图”。在“图2 数据流通示意图”中,1是将要发送的结构化数据;2是数据通;3是数据通对数据进行编码,同时把将要发送的数据以数据集装的形式存贮到关系数据库中的表(即数据发件箱);4是数据通利用电子邮件发送数据,5是网络,6是数据接收者的电子邮件系统接收电子邮件(数据),7是数据通从电子邮件系统中接收数据,8是数据通对接收到的数据进行解码并把数据存贮到关系数据库中的表中(即数据收件箱),9数据接收者所看到的与数据发送者所发送的完全一样的数据。
互联网名言:“在互联网上没人知道你是一条狗。”这针对的是匿名数据,然而对于数据流通,“你不但需要知道对方是一条狗,还有必要知道对方是哪条狗。”
契约数据流通系统集群是通过可信的第三方机构而实现全球统一的身份认证,以用户的实名邮件地址作为用户名,开放型系统根据用户的真实的身份数据而为用户分配相应的使用系统的权限,用户不必在各个信息系统中注册即可使用开放型系统。
要使流通中的结构化数据成为有效的契约数据,必须满足如下条件,契约数据流通系统集群已满足这些条件:
- 必须能够确定数据的发送方及数据的接收方的身份;
- 契约数据必须是结构化数据;
- 数据流通过程必须形成完整的证据链,可追溯、不可篡改;
- 必须能够方便地实现对收发的结构数据进行存贮、查询;
- 必须有一种通用的、统一的、标准的、使用方便的、廉价的数据流通工具。
契约数据流通系统集群(如图1所示)是由实名邮件注册管理系统及若干个以相同的技术标准而建立的契约数据流通系统和若干个以相同的技术标准而建立的开放型系统组成。契约数据流通系统集群是由第三方机构提供服务,第三方机构包括数据流通服务机构和数据流通协会。
数据流通协会包括国际数据流通协会、国家数据流通协会。国际数据流通协会由各个国家的国家数据流通协会组成。
国际数据流通协会的职责:1、负责管理国际实名邮件注册管理系统;2、制订与数据流通相关的国际标准、规范、规则、制度、服务公约等;3、负责协调各个国家之间、各个数据流通服务机构之间的关系;使大家遵守统一的国际规范;4、对数据流通服务机构的服务质量监督管理。
国家数据流通协会的职责:1、负责管理本国的实名邮件注册管理系统;2、当数据流通服务机构在实名邮件注册管理系统中注册其实名电子邮件系统时,数据流通协会负责对数据流通服务机构的资格进行审核,审核合格后把数据流通服务机构的实名电子邮件系统登记到实名邮件注册管理系统中;3、对本国的数据流通服务机构的服务质量监督管理;4、制订与数据流通相关的国家标准、规范、规则、制度、服务公约等。
数据流通服务机构的职责:1、通过用户身份管理系统为用户提供注册身份数据服务;负责对用户的真实身份的审核,对用户的身份数据进行备案;提供用户身份数据查询服务:2、利用数据通的“实名邮件系统、发送数据系统、接收数据系统、数据处理系统、数据浏览系统”为用户提供契约数据的流通服务。
实名邮件注册管理系统是全球契约数据流通的基础。实名邮件注册管理系统分为国际实名邮件注册管理系统和国家实名邮件注册管理系统。国际实名邮件注册管理系统由国际数据流通协会负责管理。国家实名邮件注册管理系统由各个国家的数据流通协会负责管理。实名邮件系统由数据流通服务机构提供。各个国家的数据流通协会负责审核本国的数据流通服务机构的资质、资格,审核合格后,数据流通协会将在实名邮件注册管理系统中注册数据流通服务服务机构的实名邮件系统。只有在实名邮件注册管理系统中注册、登记的邮件系统才是可信的实名邮件系统。国际实名邮件注册管理系统汇总各个国家的实名邮件注册管理系统中的数据。
数据通是一种实现结构化数据流通的通用的工具,由数据流通服务机构提供,由实名邮件系统、用户身份管理系统、发送数据系统、接收数据系统、数据处理系统、数据浏览系统组成。利用数据通收发数据时,由数据的发送者负责承担与数据内容相应的法律责任。契约数据流通集群中可含有若干个数据通,各个数据通由不同的数据流通服务机构提供服务。
数据通通过实名电子邮件系统实现结构化数据的传输。实名电子邮件系统也一种电子邮件系统,与普通的电子邮件系统的区别在于实名电子邮件系统是在实名邮件注册管理系统中注册的电子邮件系统,而普通的电子邮件系统未在实名邮件注册管理系统注册。实名电子邮件系统只能接收已在实名邮件注册管理系统中注册的实名电子邮件系统所发送过来的电子邮件,也只能向已在实名邮件注册管理系统中注册的实名电子邮件系统发送电子邮件。
为了实现结构化数据的可信流通,实名电子邮件系统与普通的电子邮件系统必须通过技术手段使两者相互隔离,实名电子邮件系统不能向普通电子邮件系统发送电子邮件,也不能接收普通电子邮件系统发送过来的电子邮件。实名电子邮件是为了实现结构化数据的流通,是数据通专用的数据传输工具,并不是为了收发普通的电子邮件,因此,不能向普通用户开放实名电子邮件,也不向普通用户提供使用实名电子邮件的用户名和密码。普通用户只能通过数据通而间接地使用实名电子邮件。
要实现全球范围的数据流通,就必须拥有全球统一的用户身份注册、识别的用户身份管理系统才能做到一次注册全球通用,而不能象现在的信息系统那样,每登录一个信息系统之前都要注册用户,然后才能登录使用系统。用户身份是开放型系统及数据流通中的必不可少的关键因素,是确保数据真实可信的基础。用户身份管理系统及相关服务由数据流通服务机构提供。数据流通服务机构的职责:1、对用户身份数据进行审核、确认;2、用户身份数据审核合格后为用户颁发实名数据邮件地址并开通使用数据通的权限。
用户身份管理系统包括:用户身份注册模块、用户身份审核模块、系统初始化模块、用户身份查询模块。用户身份数据注册模块是用户身份管理系统的子系统,用于实现用户注册身份数据,负责接收、存贮用户的身份数据。实名用户包括自然人用户和法人用户两种。用户身份数据注册模块的数据结构及数据内容的示例如下表1所示。在具体应用时,可根据每个自然人、法人的具体情况而由用户自己确定自己的身份数据包括哪些内容,不同用户的身份数据的内容及数据的多少可以各不相同。
表1:自然人身份数据示例表
ID | 事物代号 | 事物属性 | 事物属性值 | ... |
2122 | 数据大类 | 用户身份数据 | ||
2122 | 数据小类 | 自然人身份数据 | ||
2122 | 身份证号 | 4103051964XXXX | ||
2122 | 姓名 | XXX | ||
2122 | 房产证发证机关 | X市 X局 | ||
2122 | 毕业证发证机关 | XXX校 | ||
2122 | 实名邮件地址 |
自然人用户在用户身份数据注册模块注册时需要提供可以证明身份的文件、资料(例如身份证、户口本、职称证、结婚证、驾驶证、工作证、工作单位、职务、工作部门等)。用户可以根据情况而随时申请更新自己的身份数据。法人用户在实名用户身份认证系统注册时需要提供工商营业执照、税务机关税务登记证、组织机构代码证、各种资质证等证明身份的文件。数据流通服务机构负责对用户的真实身份数据进行审查。自然人数据通与工作用的数据通有一定的差异,自然人数据通用于处理与私人有关的数据,工作用的数据通用于处理与工作相应的数据,这是由于工作用的数据通中的数据会由单位汇总存贮,私人数据不便在单位存贮。
表2:法人用户身份数据示例表
ID | 事物代号 | 事物属性 | 事物属性值 | ... |
2165 | 数据大类 | 用户身份数据 | ||
2165 | 数据小类 | 法人身份数据 | ||
2165 | 组织机构代码 | 766246XX-X | ||
2165 | 组织机构名称 | 广州XX公司 | ||
2165 | 组织机构代码证扫描件 | |||
2165 | 实名邮件地址 | |||
2165 | 数据通密码 | ******** | ||
2165 | 组织机构代码证 | |||
2165 | 税务机关税务登记证 | |||
2165 | 工商营业执照 |
表3:组织机构内部工作人员身份数据示例表
ID | 事物代号 | 事物属性 | 事物属性值 | ... |
3166 | 数据大类 | 用户身份数据 | ||
3166 | 数据小类 | 工作人员身份数据 | ||
3166 | 组织机构名称 | X省X市X局 | ||
3166 | 组织机构分类 | 政府机关 | ||
3166 | 查询共享数据的权限 | 电子证照 | ||
3166 | 姓名 | XXXXXX | ||
3166 | 实名邮件地址 |
用户身份审核模块由数据流通服务机构使用,用于审核用户身份数据。数据流通服务机构对用户注册的身份数据进行审核,审核发现问题时通知用户修改;审核用户身份数据合格后为用户颁发实名邮件地址,并为用户开通使用数据通的权限,并调用系统初始化模块完成用户使用数据通的初始化工作。用户登录数据通的用户名及密码统一为“用户的实名邮件地址+密码”形式,这可以实现全球统一的用户帐号管理。
在为用户建立登录数据通帐号后,数据通的系统初始化模块将自动地为用户建立“数据发件箱、数据收件箱”。数据发件箱在关系数据库中以一张表的形式存贮已发送的各种结构化数据,数据收件箱在关系数据库中以一张表的形式存贮已接收到的各种结构化数据。数据发件箱与数据收件箱可设置为数据流通机构的数据库中的表,也可设置为用户自己本地的数据库中的表。
用户身份查询模块用于查询用户的身份数据。在查询用户身份数据时,必须首先征求用户意见,用户同意时,用户身份查询子系统才会提供身份数据。例如,用户A想查询用户B的身份,用户A可以利用自己的数据通向用户B对应的数据流通服务机构的指定的实名邮件,例如webmaster@xxxxx.com,发送查询用户B的身份的请求;数据流通服务机构的用户身份查询模块收到用户A的查询请求后把用户A的请求转发给用户B,若用户B同意向用户A提供自己的身份数据则回复同意;用户身份查询模块接收到用户B同意向用户A提供身份数据时,用户身份查询模块则查询用户B的身份数据并向用户A提供用户B的身份数据;若用户B不同意向用户A提供身份数据时,用户身份查询子系统回复用户A,说明用户B不同意提供身份数据。
数据通的发送数据系统通过如下步骤而发送结构化数据:
步骤1、与发送普通电子邮件一样,输入收件人的邮件地址、邮件标题及邮件内容;用SQL语句把将要发送的结构化数据存贮在DataSet中;发送数据系统自动地把DataSet中的数据转换为XML文件并添加到邮件附件中,并获得结构化数据的数据结构编码,把编码合并到邮件内容中,数据结构编码与邮件内容两者之间以特殊字符分开,例如特殊字符可为“!@~#”;若邮件中包含附件之类的文件,则作为邮件的附件加到邮件中;当结构化数据中含有图片、WORD文档等数据时,结构化数据转换为XML文件后,若不能明确地标识图片、WORD文档等数据,那么数据由XML文件转换为关系数据库中的数据时会出现问题,不能原样转换为对应的数据,因此,需要通过一定的编码来标明结构化数据的数据结构及其中所包含的数据,需要有相应的编码来标明数据的具体内容,数据编码添加到邮件内容中,这是由系统自动实现的,也由系统自动解码。为了避免解码XML文件出问题,应限制数据通发送不是由数据通自己产生的XML文件,若非要发送,则把XML文件转换为压缩文件的方式来发送;数据通在发送数据时,用户身份数据是由数据通根据用户注册的身份数据而生成的,不是用户填写的,这可确保用户身份数据是可信的。用户可设置在发送数据时提供哪些身份数据。
步骤2、在发送邮件之前,首先判断收件方的邮件地址是否为实名邮件地址,若是实名邮件地址则发送,若不是实名邮件地址则不发送数据并提醒用户;
步骤3、数据发送系统发送邮件;
步骤4、数据发送系统调用数据通的数据处理系统,数据处理系统把所要发送的结构化数据及邮件地址、邮件标题、邮件内容及发送者身份数据转换为数据集装箱的结构形式,并把数据存入数据发件箱,若有附件,则附件存入指定的文件夹中;数据发件箱与电子邮件的发件箱是完全不同的,数据发件箱为关系数据库中的一张表,表中存贮的是已发送的各种结构化数据。数据集装箱是记录收发的契约数据的容器,在契约数据流通系统集群中,契约数据的每一次的流通中的相关的数据全部存贮在一个数据集装箱之中。
为了方便软件设计人员发送结构化数据,数据通的发送数据系统可以设计为DLL动态链接库。
接收数据系统接收数据的过程与接收普通电子邮件完全相同,所不同的是接收到数据之后如何存贮、处理数据。接收数据系统通过如下步骤接收、存贮、处理数据:
步骤a、在接收之前需要判断相应的电子邮件是不是实名数据邮件,若是则接收,若不是则不接收并提醒用户;
步骤b、接收邮件中的数据;
步骤c、把接收到的邮件的附件存贮到指定的文件夹,该文件夹由数据通自动为每个用户建立,不同用户的数据存入不同的文件夹;接收数据系统所接收的每一个邮件中所有附件全部存入同一个子文件夹,子文件夹名可设置为收件流水号,不同邮件的附件存入不同的子文件夹;
步骤d、调用数据处理系统处理接收到的数据,把数据以数据集装箱的结构形式存入数据收件箱。
数据处理系统的功能之一是把已发送的数据存贮到数据发件箱,功能之二是把接收到的结构化数据经过解码后存贮到数据收件箱之中。
契约数据流通系统集群是通过数据集装箱(如图3、图4、图5所示)的方式来解决数据流通过程中的结构化数据的多源异构问题。数据集装箱使得结构化数据流通中的多源异构问题通过标准的数据集装箱而得到解决。交通运输行业是通过如下方式而运输货物:1、货物装入集装箱;2、运输货物;3、接收货物;4、拆箱取货。在契约数据流通系统集群中,数据集装箱只是为了在数据发件箱和数据收件箱存贮结构化数据,在数据的传输环节不使用数据集装箱;普通用户所看到的是数据发件箱及数据收件箱中的结构化数据,数据的收发过程是普通用户看不到的,用户在数据收件箱和数据发件箱中看到的是数据集装箱中的内容,因此对普通用户而言数据通犹如是以集装箱的形式传输的。
为了高效地实现数据共享,可以开发数据通的CS架构接收数据系统,其功能是自动地定时接收数据,并把数据以数据集装箱的结构形式存入数据收件箱(也可把数据收件箱设置为本地数据库中的表)。
数据集装箱中的数据分为“数据封面、发送者身份、数据流通状态、数据内容”4个组成部分,同一数据集装箱中的数据全部存入同一张表中。
数据发件箱中的数据集装箱的数据结构和数据内容如表4所示:
表4:数据集装箱、数据发件箱中的数据的数据结构示例
ID | 事物代号 | 事物属性 | 事物属性值 | ... |
38999 | 数据集装箱编号 | 16698 | 【注:数据封面数据】 | |
38999 | 数据分类 | 数据封面 | ||
38999 | 收件人地址 | xxxx@xxxxx.com | ||
38999 | 邮件标题 | 销售订单 | ||
38999 | 邮件内容 | XXXXX | ||
39000 | 数据集装箱编号 | 16698 | 【注:发送者身份数据】 | |
39000 | 数据分类 | 发送者身份 | ||
39000 | 发送者姓名 | XXX | ||
39000 | 发送者单位 | XXX公司 | ||
39000 | 数据发送者的职责权限 | |||
39001 | 数据集装箱编号 | 16698 | 【注:数据流通状态】 | |
39001 | 数据分类 | 数据流通状态 | ||
39001 | 数据流通状态 | 已发送到对方的数据通 | ||
39001 | 撤回 | |||
39001 | 发送数据的时间 | 2022/6/9 | ||
39001 | 接收数据的时间 | |||
39001 | 回复数据的时间 | |||
39002 | 数据集装箱编号 | 16698 | 【注:数据内容】 | |
39002 | 数据分类 | 数据内容 | ||
39002 | 事物名称 | 销售订单 | ||
39002 | 订单编号 | XXXX79789 | ||
39002 | 订单ID | 10248 | ||
39002 | 销售负责人 | 赵军 | ||
39002 | 订购日期 | 2022/6/9 | ||
39002 | 到货日期 | 2022/6/19 | ||
39002 | 发货日期 | 2022/6/10 | ||
39002 | 运货商 | 四通货运 | ||
39002 | 运货费 | 32.38 | ||
39002 | 货主名称 | 余小姐 | ||
39002 | 货主地址 | 光明路124号 | ||
39003 | 数据集装箱编号 | 16698 | ||
39003 | 数据分类 | 数据内容 | ||
39003 | 数据大类 | 产品销售系统 | ||
39003 | 数据小类 | 销售订单明细 | ||
39003 | 事物品种 | 猪肉 | ||
39003 | 订单ID | 10248 | ||
39003 | 商品名称 | 排骨 | ||
39003 | 单价 | 50 | ||
39003 | 数量 | 12 |
在数据通中,每个用户拥有一个数据发件箱,每个用户的数据发件箱中的全部结构化数据全部存贮到一个指定的表中,该表由系统自动生成。数据通每发送一个邮件,邮件中的数据都存贮到一个数据集装箱中,数据集装箱的数据结构如表4所示。在数据发件箱中,每一个数据集装箱都有一个唯一的数据集装箱编号。数据集装箱的编号由数据通统一编码,数据集装箱编号一般可设置为发件流水号。在数据发件箱中,数据集装箱的数据分为“数据封面、发送者身份、数据流通状态、数据内容”4个组成部分。
数据发件箱中的数据集装箱的数据封面的数据内容为:数据集装箱编号、数据分类(注:数据分类对应的数据为“数据封面”)、收件人地址、邮件标题、邮件内容。
发送者身份数据的内容为:数据集装箱编号、数据分类(注:数据分类对应的数据为“发送者身份”)、发送者姓名、发送者单位、数据发送者的职责权限等内容。若发送者为自然人用户则发送者身份数据中可不包括“发送者单位、数据发送者的职责权限”。数据发送者身份数据由用户设置,用户可设置为对方提供哪些身份数据;身份数据的内容是由数据通根据用户身份管理系统中的数据而生成。
数据流通状态的内容为:数据集装箱编号、数据分类(注:数据分类对应的数据为“数据流通状态”)、数据流通状态、撤回、发送数据的时间、接收数据的时间、回复数据的时间。数据流通状态数据由数据通自动生成。“数据集装箱编号”是当前的数据通所发送的数据及相关内容的数据集装箱编号;“数据流通状态”表明数据是否已发送到对方的数据通中、对方是否已接收到数据(由数据接收方的数据通反馈过来);“撤回”是撤回当前发送的数据,若对方已接收数据,则不可撤回;“接收数据的时间”由数据接收方的数据通反馈过来。“数据流通状态”的内容由数据通系统自动生成。
数据内容中的相关数据项为:数据集装箱编号、数据分类(注:数据分类对应的数据为“数据内容”)、相关的结构化数据的内容。数据通只负责收发结构化数据,不对收发的数据的内容进行限定,发送什么样的数据完全由发送者自己决定。数据通只负责原样传输数据,不对数据的真实性负责,数据的发送者需要对发送的数据承担相应的法律责任。
数据收件箱中的数据集装箱的数据结构及数据内容如表5所示:
表5:数据集装箱、数据收件箱中的数据及数据结构示例
ID | 事物代号 | 事物属性 | 事物属性值 | ... |
77328 | 数据集装箱编号 | 6828 | 【注:数据封面数据】 | |
77328 | 数据分类 | 数据封面 | ||
77328 | 发件人地址 | XXXX@XXXX.COM | ||
77328 | 邮件标题 | 销售订单 | ||
77328 | 邮件内容 | XXXXX | ||
77329 | 数据集装箱编号 | 6828 | 【注:发送者身份数据】 | |
77329 | 数据分类 | 发送者身份 | ||
77329 | 发送者姓名 | XXX | ||
77329 | 发送者单位 | XXX公司 | ||
77329 | 数据发送者的职责权限 | |||
77330 | 数据集装箱编号 | 6828 | 【注:数据流通状态】 | |
77330 | 数据分类 | 数据流通状态 | ||
77330 | 数据流通状态 | 未回复(已回复) | ||
77330 | 发送数据的时间 | |||
77329 | 接收数据的时间 | |||
77330 | 回复数据的时间 | |||
77331 | 数据集装箱编号 | 6828 | 【注:数据内容】 | |
77331 | 数据分类 | 数据内容 | ||
77331 | 事物名称 | 销售订单 | ||
77331 | 订单编号 | XXXX79789 | ||
77331 | 订单ID | 10248 | ||
77331 | 销售负责人 | 赵军 | ||
77331 | 订购日期 | 2022/6/9 | ||
77331 | 运货商 | 四通货运 | ||
77331 | 运货费 | 32.38 | ||
77331 | 货主名称 | 余小姐 | ||
77331 | 货主地址 | 光明路124号 | ||
77332 | 数据集装箱编号 | 6828 | ||
77332 | 数据分类 | 数据内容 | ||
77332 | 数据大类 | 产品销售系统 | ||
77332 | 数据小类 | 销售订单明细 | ||
77332 | 事物品种 | 猪肉 | ||
77332 | 订单ID | 10248 | ||
77332 | 商品名称 | 排骨 | ||
77332 | 单价 | 50 | ||
77332 | 数量 | 12 |
在数据通中,每个用户拥有一个数据收件箱,每个用户的数据收件箱中的全部结构化数据全部存贮到一个指定的表中,该表由系统自动生成。在数据收件箱中,每一个数据集装箱都有一个唯一的数据集装箱编号。数据集装箱的编号由数据通统一编码,数据集装箱编号一般可设置为收件流水号,数据收件箱中的数据集装箱编号与数据发件箱中的数据集箱编号不是同一个编号。数据通每接收一个邮件,邮件中的数据都存贮到一个数据集装箱中,数据集装箱的数据结构如表5所示。在数据收件箱中,数据集装箱的数据为“数据封面、发送者身份、数据流通状态、数据内容”4个组成部分。
数据封面的数据内容为:数据集装箱编号、数据分类(注:对应的数据为“数据封面”)、发件人地址、邮件标题、邮件内容。
发送者身份的数据内容为:数据集装箱编号、数据分类(注:对应的数据为“发送者身份”)、发送者姓名、发送者单位、数据发送者的职责权限等,若发送者为自然人用户则发送者身份数据中可不包括“发送者单位、数据发送者的职责权限”。发送者身份数据由发送者所用的契约流通系统根据发送者身份数据及发送者自己的设置而生成的。
数据流通状态的数据内容为:数据集装箱编号、数据分类(注:对应的数据为“数据流通状态”)、数据流通状态、发送数据的时间、接收数据的时间、回复数据的时间。数据流通状态数据由数据通自动生成。此处的“数据分类”为“数据流通状态”;“数据流通状态”为“未回复、已回复”,“数据流通状态”的内容由数据通系统自动生成。
数据内容中的相关数据项为:数据集装箱编号、数据分类(注:对应的数据为“数据内容”)、相关的结构化数据内容。
接收数据时数据处理系统处理数据的步骤:步骤a、接收邮件中的数据;步骤b:从邮件内容中截取与数据结构相关的编码;步骤c、根据数据编码把接收到的XML文件解码成结构化数据;步骤d、把“发件人邮件地址、邮件标题、邮件内容”、数据流通状态及解码后的数据存入数据集装箱;步骤e、把数据集装箱中的数据存入数据收件箱中。
数据收件箱、数据发件箱是关系数据库中的表,该表可以设置为数据流通服务机构的关系数据库中的表;也可设置为用户方局域网中的关系数据库中的表,这样就可以使用户在本地的数据库中处理收发的结构化数据。
为了方便普通用户使用数据通,数据通在展示数据的形式上与电子邮件类似,数据通自动地把接收到的数据转换为结构化数据。对普通用户而言,接收、浏览各种结构化数据犹如电子邮件那样简单,这是现有技术未做到的,目前也没有这样的产品。数据通可以接收各种信息系统发来的各种各样的结构化数据,例如水电费、银行流水、电子商务等方面的结构化数据。
与普通电子邮件所不同的是:普通用户在数据通所看到的是结构化数据,电子邮件中的数据是非结构化数据。
数据通的数据浏览系统可以两种方式展示接收到的数据,一是以数据集装箱的结构方式展示给用户;二是把数据集装箱中的数据转换为若干张二维表方式展示给用户,二维表中的数据存贮在DataSet中,对用户而言,发送的是若干二维表中的数据,接收的也是二维表中的数据,这可以使用户所看到的数据的结构形式与发送所发送的结构完全一样。
数据流通系统可分为实名数据流通系统、匿名数据流通系统及内部用流通系统。匿名数据流通系统所收发的只是数据,数据是否可信完全由数据的接收者自己判断,数据的发送者不必为数据的真伪承担法律责任。数据通与匿名数据流通系统相互隔离,不能直接互联互通,目的是为了尽量避免用户因操作的失误而把匿名数据发送到实名的数据通中。匿名数据流通系统与数据通的原理是一样的。内部数据流通系统的原理与实名数据通是一样的,只是只能供组织机构内部使用,不能与外界的系统互联互通。内部数据流通系统只要遵守内部规定即可。
开放型系统的定义:以实名电子邮件地址作为用户名,以用户身份数据作为信息系统权限管理的基础,以数据通作为数据流通的工具的信息系统,从而实现全球统一的“单帐号登录系统、用户身份认证、系统权限管理、数据流通”的信息系统称作是开放型系统。开放型系统是在数据通的基础上而实现的。
开放型系统主要是为了解决两个问题:一是实现“单帐号登录、统一登录”,用户只要在数据通的用户身份管理系统中“一次注册”身份数据,即可做到全球通用,不必在各个开放型系统中再注册用户,用户直接输入实名邮件地址即可在全球范围内使用各种开放型系统。二是全球范围内众多的信息系统都可以利用数据通把数据发送给用户,用户可以保存、查询数据流通痕迹。
对于传统的契约而言,双方都要保留契约原件,然而在现有技术中,现有的各种信息系统,例如各种电子商务平台、电子政务平台都只是平台单方保留数据流通痕迹,而平台未把数据流通痕迹发给最终用户方。此处的数据流通痕迹指的是结构化数据而不是非结构化数据。电子商务平台虽保留了买卖双方的数据流通痕迹,然而不同的电子商务平台所产生的数据也难以汇总,也不能让最终用户可以通过一种工具而查询在各平台上所产生的数据流通痕迹,因各平台所产生的数据是结构各不相同的结构化数据,即多源异构的数据。
契约数据流通系统集群所实现的是“一次注册用户身份数据,然后用同一用户帐号登录全球范围的开放型系统”。契约数据流通系统集群中的用户帐号统一为“实名邮件地址+密码”,或只要“实名邮件地址”不要“密码”也可以登录全球范围的所有开放型系统。
在信息系统权限管理方面,契约数据流通系统集群与传统方法也完全不同。传统的“统一认证及单点登录”系统是根据注册的用户而为用户授权,根据授权而发令牌,根据令牌而登录同一单位内部的各种信息系统,从而实现单点登录。契约数据流通系统集群的“统一注册,单帐号登录”所实现的是:用户只要在契约数据流通系统集群中的任何一个数据通中的用户身份管理系统中注册一次用户身份数据并获得用户帐号后,用户就可以用这一个帐号而登录全球范围内的所有开放型系统。现有技术的问题是未能实现统一注册,因此,肯定实现不了统一认证;只有实现全球用户的身份数据的“统一注册”,才能实现全球信息系统的用户身份“统一认证”,因为注册是认证的基础。契约数据流通系统集群不要求用户在同一数据流通服务机构注册身份数据。用户可在不同国家、不同的数据流通服务机构的用户身份管理系统中注册用户,各个数据流通服务机构必须是采用全球统一的、标准的用户身份注册方法,用户身份数据的结构和数据内容也必须标准化,特别是不同国家、不同语言的用户身份数据也必须符合统一的标准,只有数据结构、内容统一、标准,才能实现统一认证。概括而言,契约数据流通系统集群所实现的是“全球统一身份注册、统一身份认证、统一用户帐户管理、统一权限管理”。
开放型系统以两种方式实现用户登录系统并实现“一次注册用户全球通用”的用户管理的方法:
第一种是以“实名邮件地址+密码”的方式登录开放型系统,相应步骤是:
步骤a1.1、用户X在第一次登录某个开放型系统时,在系统中输入自己的实名邮件地址及自己设定的密码,然后点击登录系统;
步骤a1.2、开放型系统判断用户X是不是第一次登录系统,若用户X是第一次登录开放型系统,则开放型系统通过数据通的用户身份管理系统获得用户身份数据:
步骤a1.3、开放型系统接收到用户X的身份数据后根据用户X的身份数据而为用户X分配使用系统的相应的权限,并记录用户的身份数据;开放型系统记录用户X设定的“实名邮件地址+密码”的登录系统的帐号并允许用户X登录系统;
步骤b1.1、若用户已登录过开放型系统,用户X可用“实名邮件地址+密码”方式而登录系统。
第二种是以“只要实名邮件地址,不要密码登录系统”的方式登录开放型系统,相应的步骤是:
步骤a1.1、用户X在登录某个开放型系统时输入自己的实名邮件地址;
步骤b1.1、开放型系统判断用户X是不是第一次登录系统,若用户X是第一次登录系统,则开放型系统通过数据通的用户身份管理系统获得用户身份数据:
步骤b1.2、开放型系统接收到用户X的身份数据后根据用户X的身份数据而为用户X分配使用系统的相应的权限,并记录用户的身份数据;
步骤b1.3、开放型系统把用户登录系统的链接发送到用户X的数据通;
步骤b1.4、用户X在自己的数据通中点击链接地址即可登录开放型系统;
步骤b2.1、若用户已登录过开放型系统,开放型系统根据已记录的用户身份数据而直接把用户登录系统的链接发送到用户X的数据通,
步骤b2.2、用户X在自己的数据通中点击链接地址登录开放型系统。
各数据通可统一采用“webmaster@实名电子邮件域名”的实名邮件地址接收用户身份数据查询请求。开放型系统通过可信的第三方数据流通服务机构而获得用户真实的身份数据,再根据用户身份而为用户分配使用系统的权限。
开放型系统的系统权限管理的实现步骤:步骤a、根据用户的身份数据而为用户分配使用系统的角色;步骤b、根据用户的角色而为用户分配使用系统的权限。例如,根据用户的性别、年龄而为用户分配不同的使用系统的角色、权限,也可以根据用户的工作单位、职务、部门等而为用户分配不同的使用系统的角色、权限,也可以根据用户的国籍、居住地、民族等而为用户分配不同的使用系统的角色、权限。
对于传统的契约而言,只有当事人双方都签字确人后才生效,双方都要保留契约原件。目前的信息系统在接收组织机构之外的用户数据时存在的问题:用户在信息系统录入数据后,信息系统会留下用户录入数据的记录,然而用户方未能留下自己录入的数据的记录。在设计开放型系统时,要求开放型系统及系统的用户双方都留下双方交流的数据流通痕迹。开放型系统与系统用户之间的数据交换、使双方都能保留数据流通痕迹是按以下步骤来实现:步骤a、开放型系统通过数据通而把用户录入的数据,或系统产生的与用户相关的数据,发送给用户;步骤b、用户在自己的数据通中对数据进行核对;步骤c、用户对数据核对无误后给开放型系统回复确认;步骤d、开放型系统根据用户回复的意见而处理用户录入的数据,或处理系统产生的与用户相关的数据。
当前的各种在互联网上运行的信息系统只要少量的升级改造即可成为开放型系统,只要对下面三方面的内容进行升级即可:以实名电子邮件地址作为用户名、以用户身份数据作为信息系统权限管理的基础、以数据通作为数据交换的工具。现有的信息系统通过上述的升级,即可升级为开放型系统,并实现全球统一的身份认证识别、系统权限管理、数据流通。
推式数据通信的实现方式可按以下步骤实现:
步骤1、各种信息系统通过数据通把结构化数据推送到数据接收方的数据通中;
步骤2、数据接收方从数据通的数据收件箱中接收、处理收到的数据。
拉式数据通信通过如下操作步骤而实现:
步骤a、数据需求方通过数据通向数据提供方发送查询处理数据的参数,该参数的格式由数据提供方设定,参数存贮在二维的表中即可,数据需求方只要按数据提供方设定的格式设置查询参数即可;步骤b、数据提供方从数据通中接收数据;步骤c、数据提供方利用用户身份管理系统的查询模块查询用户身份,并根据用户身份判断数据需求方是否具有查询处理数据的资格、权限,若有查询处理数据的资格、权限,则执行一步的查询处理数据操作;步骤d、数据提供方判断数据需求方提供参数是否符合要求,若参数合格则根据参数而执行相应的功能;若参数不合格则通过数据通回复数据需求者参数不合格;步骤e、数据提供方根据接收到的参数查询处理数据;步骤f、数据提供方利用数据通把查询处理结果发回给数据需求方;步骤g、数据需求方从数据通中获得查询处理结果。
拉式数据通信的适用范围:数据需求方发送结构化数据作为查询处理数据的参数,数据提供方返回结构化数据的应用。通过契约数据流通系统集群的数据通而实现结构化数据通信可以大幅度降低数据流通的成本而不需要配置前置机,因为数据通与业务系统之间是通过电子邮件而间接联系。利用拉式数据通信可以实现不同单位之间的数据共享。
利用数据通按以下步骤即可实现不同单位之间的协同审批:1、用户A通过数据通将数据(例如该数据可以是公文、订单、合同等)发送给用户B(或多个用户);2、用户B通过数据通接收数据;3、用户B对数据进行编辑并加上自己的意见;4、用户B通过数据通把编辑后的数据发回给用户A,或发送给用户C(或多个用户)。
下面的应用示例是利用契约数据流通系统集群实现电子证照的全国互通互认,这涉及到全国14亿人、数千万个组织机构,也涉及到全国各级政府机关、数以万计的各种电子证照的数据。
国务院办公厅(2022年1月20日)的文件《关于加快推进电子证照扩大应用领域和全国互通互认的意见》(国办发〔2022〕3号):“从全国层面看,电子证照还存在标准规范不健全、互通互认机制不完善、共享服务体系不完备、应用场景不丰富等突出问题......避免‘点对点’、‘多对多’重复对接......”。
契约数据流通系统集群是通过无接口的间接方式实现电子证照的全国互联互认,因此可从根本上“避免‘点对点’、‘多对多’重复对接”,这是契约数据流通系统集群与现有技术的本质的不同;现有技术是通过API、Web Servies这种“点对点”式直接连接的数据接口而实现数据对接。
利用契约数据流通系统集群实现电子证照的全国互联互认时,电子证照数据的提供方与需求方之间不需要通过数据接口而实现数据共享,双方是通过契约数据流通系统而间接地实现数据共享,其方法为:1、数据的需求方通过数据通把查询数据的参数发送给数据的提供方;2、数据的提供方通过数据通接收查询数据的参数;3、数据的提供方根据查询数据的参数而查询数据;4、数据的提供方通过数据通把查询结果发送给数据的需求方;5、数据的需求方从数据通中接收数据的提供方发送的查询结果。
电子证照的数据相对比较简单,大多数情况下只要一张表即可存储电子证照的数据,因此,可开发出通用的CS版的电子证照共享数据查询系统。对于极个别的比较特殊的电子证照,可开发专用的电子证照共享数据查询系统。为了实现电子证照数据的共享,电子证照数据的提供方需要建立电子证照共享数据查询系统。电子证照共享数据的提供方通过如下4步而实现电子证照数据的共享:
第一步:电子证照的共享数据提供方需要选择一个数据流通服务机构,在该机构注册用户,获得数据通使用权限、实名电子邮件地址、数据通的CS版的数据接收系统、发送数据的DLL。也需要获得通用版的电子证照共享数据查询系统。
第二步:在“全国一体化政务服务平台”建立“电子证照发证机关与实名邮件地址对照表”,该表的功能是使用户可以通过电子证照的发证机关的名称而查询到该机关是用哪个实名邮件地址实现电子证照的数据共享的传递,发证机关的每一种电子证照对应一个实名邮件地址,如下表6所示。该表由电子证照数据的提供方(发证机关)负责登记。
表6 电子证照发证机关与名邮件地址对照表
ID | 发证机关 | 电子证照名称 | 实名邮件地址 | 备注 |
第三步:安装、配置数据通的CS版的数据接收系统和电子证照共享数据查询系统,安装在可以收发电子邮件的局域网中即可。
第四步:运行数据通的CS版的数据接收系统和电子证照共享数据查询系统。
电子证照共享数据查询系统按如下步骤现实现共享数据的查询:
- 电子证照共享数据查询系统定时自动地查询数据通的CS版的数据接收系统接收到的数据,这些数据为数据需求方所发送的查询参数,该数据已存储到本地指定的关系数据库中。
- 若接收到数据,则根据数据中的需求方的身份判断数据需求方是否具有查询处理数据的资格、权限,若有查询处理数据的资格、权限,则执行下一步的查询处理数据操作。
- 从收到的数据中获得查询参数;判断参数是否符合要求,若参数合格则根据参数而查询数据;若参数不合格则通过契约数据流通系统回复数据需求方参数不合格。(注:可统一规定,若查询的证照是自然人的证照,则查询参数为:“XX电子证照、自然人姓名、身份证号”,若查询的证照是法人的证照,则查询参数为:“XX电子证照、法人单位名称、统一信用代码”,这是根据电子证照数据的特性而设定的参数,遇到特殊情况再作特殊处理;由于不同的电子证照数据千差万别,需要对数据进行适当的治理,只要治理成人可阅读的形式即可。)
- 若查到相应的电子证照数据,则利用数据通的发送数据的DLL动态库,把查询结果推送给数据需求者;若查不到相应的电子证照数据,则回复”“未查到‘自然人姓名、身份证号’(或法人单位名称、统一信用代码)的电子证照数据”。
电子证照共享数据查询系统自动完成电子证照数据的共享,不需要人工干预。
电子证照共享数据的一种应用场景是在各种行政审批系统中使用电子证照共享数据,针对的是政务服务中的“跨省通办”、“一网通办”、“不见面审批”、“最多跑一次”。为了在行政审批系统中使用电子证照共享数据,需要对现有的行政审批系统进行升级改造,或开发新的行政审批系统。建议行政审批系统设计为开放型系统。行政审批系统主要有两种用户,一是行政相对人(即去行政机关去办事的人员,包括自然人、法人,下面的示例以自然人为例),二是行政单位的审批人员。
行政相对人也需要选择一个数据流通服务机构,在该机构注册用户,获得数据通使用权限、实名电子邮件地址。行政相对人在申请数据通时,在自己的用户身份数据中注明各种证照的发证机关(如表1所示),目的是为了使行政审批系统可以根据发证机关而自动地获得该证照的数据,用户只要在行政审批系统中输入自己的实名邮件地址即可。
行政审批系统面对的是公众,因此需要部署在互联网上;也需要安装数据通的CS版数据接收系统,用于接收电子证照共享数据查询系统反馈回来的电子证照共享数据;也需要获得发送数据的DLL。为了简化电子证照的查询,行政机关的行政审批人员在登记用户身份时,可根据如表3的示例登录身份,其中的“查询共享数据的权限”为“电子证照”,当该用户利用实名邮件发出查询电子证照的请求时,共享查询系统根据收到的电子邮件中含有这样的内容时,可不审核该用户的身份而直接授予查询权限。
行政相对人登录行政审批系统的办事过程:
- 行政相对人输入的数据:输入实名邮件地址,登录行政审批系统。
- 系统提示行政相对人,需要获得某个证照的发证机关的数据,行政审批系统通过数据通询问行政相对人是否同意提供该数据,若同意,则系统自动地从数据通的用户身份管理系统中获得发证机关的数据;若行政相对人的身份中已含有相关证照的发证机关,则系统自动地获得;若无,则提示用户。
- 若需要多个证照,则重复上述操作。
- 行政相对人提交数据的时触发行政审批发送数据的事件:A、根据电子证照的名称及发证机关的名称从“电子证照发证机关与实名邮件地址对照表”中查询出发证机关所用的实名邮件地址;B、利用发送数据的DLL动态库把查询电子证照的数据的请求发送给电子证照的共享数据的提供方。
行政审批人员的页面及操作:行政审批人员登录行政审批系统后,行政审批系统自动触发各个办事申请的查询事件;查询事件执行后有三种结果:一是对方还未把查询结果发送过来(因对方并不是实时响应,要等一段时间,也可能对方的系统出问题),二是已查到电子证照数据并在页面中标注,三是未查到电子证照数据并在页面标注。行政审批人员点击某个办事申请,触发相关查询事件;如下表7所示:
表7 证照列表
序号 | 证照名称 | 查询结果 | 查看证照数据 | 备注 |
1 | 房产证 | 未查到 | ||
2 | 户口本 | 已查到 | 点击查看数据 |
若行政审批人员要查看具体的数据,则点链接,系统展示出有关数据。行政审批人员页面的系统处理数据的过程: 因CS版数据接收系统会自动地定时地接收电子证照共享数据,并把数据存储到指定的本地数据库中,行政审批系统可以直接从本地数据库中查询数据。
注意事项:1、契约数据流通系统集群把数据流通当作单独的一件事来处理,所实现的是结构化数据的流通,即照原样收发结构化数据,不包括数据的识别及治理,数据的识别及治理由收发数据的双方根据实际情况而处理;2、为了使契约数据流通集群能在全球范围内成为通用的数据流通工具,使开放型系统成为单帐号登录的系统,必须使数据通和开放型系统的用户和权限管理统一化、标准化,必须按同一标准而设计数据通和开放型系统。
同一个契约数据集群的定义:按同一标准而开发若干个数据通及若干个开放型系统所组成的集群是同一个集群,相应的数据通之间可以实现互联互通,相应的开放型系统可以实现单帐号登录。按不同标准而设计数据通及开放型系统所组成的集群是不同的集群,不同的集群之间在实现互联互通时会出现问题。
开放型系统的标准化设计要求:开放型系统必须以“用户登录帐号、用户身份注册、用户身份认证、信息系统的权限管理”的统一化和标准化为基础,即“统一采用‘实名邮件地址+密码’,或‘只有实名邮件地址,不需要密码’的用户帐号管理方式”,统一根据用户身份管理系统中的用户真实身份数据而进行用户身份认证,用户身份管理系统中的用户身份数据的数据结构和数据内容必须标准化、统一化,统一根据用户真实身份数据而为用户分配系统使用权限。
数据通的标准化设计要求:“用户身份管理系统中的用户身份数据的数据结构和数据内容、发送数据系统的发送数据的方法及发送数据的编码、数据接收系统的接收数据的方法及接收数据的解码、数据集装箱的数据结构”必须标准化、统一化。
若将契约数据流通系统集群中的各个系统折分之后应用则不能产生出契约数据流通系统集群的技术效果,例如,若无契约数据流通系统集群,就不可能实现单账号登录系统,也不可能实现可信的结构化数据的流通。单帐号登录系统需要以数据通中的户身份管理系统为基础,而这是契约数据流通系统集群的一部分,数据通由数据流通服务商提供,数据流通服务商则由协会审核、监督管理才能做到数据流通的可信。契约数据流通系统集群的技术效果是在契约数据流通系统集群中的各个系统及其子系统和国际数据流通协会、各个国家的数据流通协会和众多的数据流通服务商的整体作用下而产生的。
1.5有待探讨的问题
可信数据空间是一个比较新的概念,《计划》及相关附件中的部分内容是错误的,出现错误的根源在于未能摆脱现有的孤岛型软件理论体系的影响。国家提出建立可信数据空间的目的在于根除数据孤岛,实现数据高效流通,然而,数据孤岛是IT行业的老大难,在过去的20多年的时间内,全球无数技术人员想尽了各种方法,至今也未能根除,反而越来越严重。要根除数据孤岛,必须建立新的开放型软件理论体系。可以肯定的是,若还是以现有的孤岛型软件理论体系而建立可信数据空间,结果必定再次走入数据孤岛的死路!
1.5.1“到2028年,建成100个以上可信数据空间”的说法是错误的,犹如不能说“建成100个以上的互联网”
《计划》提出:“到2028年,建成100个以上可信数据空间......”,这是错误的,正确的应为“到2028年,建成包含100种以上数据的可信数据空间”。因为,《计划》认为:“可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施。”若说成是“建成100个以上可信数据空间”,就意味着建成“100种以上的‘数据流通利用基础设施’”,这会导致可信数据空间建设再次走入数据孤岛的老路!
可信数据空间是一种“数据流通利用基础设施”,这种设施应犹如互联网一样,“全球范围的网络必须以全球统一的、标准的方法建立,大家共同组成互联网”,在互联网中,各个国家有很多线路、很多设备、很多数据,大家共同组织成一个互联网,而不是很多个“互联网”。
《计划》中也提出建立“企业可信数据空间、城市可信数据空间、跨境可信数据空间、个人可信数据空间”,其含义仿佛是各种独立的四种可信数据空间、四种数据孤岛,这犹如不能说“企业互联网、城市互联网、跨境互联网、个人互联网”。
建设可信数据空间中最忌讳的就是:各自独立地建设自己的可信数据空间。
在可信数据空间建设中,一定要遵循“统一标准”的原则,不能各自为政。
1.5.2“身份认证向下兼容”是有问题的
《可信数据空间发展引导体系(1.0版)》中包括这样的内容:“接入核验审查:宜集成公安、税务、市场监管等身份核验机制”。
可信数据空间的身份认证必须是全球统一的、标准的、通用的。可信数据空间中的新的身份认证实现不了向下兼容。
1.5.3银行、微信支付、支付宝、拼多多中的数据是不是可信数据空间中的可信数据?
银行、微信支付、支付宝、拼多多中的数据是不是可信数据空间中的可信数据?这个问题可以根据《计划》对可信数据空间的定义来判断。
当前的银行、微信支付、支付宝、拼多多中的数据也可称作是可信数据空间中的数据,然而,这些可信数据空间是一种各自为政的数据孤岛型可信数据空间中的可信数据。如果《计划》所要建立的可信数据空间还是这样的非常封闭的一个个独立的数据孤岛,肯定会走入死路!
《计划》所期望的是建立“全球统一的、标准的、互联互通的可信数据空间”。因此,当前的银行、微信支付、支付宝、拼多多中的数据不是可信数据空间中的可信数据。
《计划》所要建立的可信数据空间是希望微信支付与支付宝之间是可以联通的,用户在微信支付与支付宝的所有收入与支出都在第三方公证平台进行公证,而且可在第三方公证平台查询每一笔收入与支出,法律也保证第三方公证平台的数据具有法律效力。
1.5.4可信数据空间不应参与“数据转换”
下图来源于“《计划》附件1:名词解释”。
上图所存在的问题是:“数据转换”。
上图是针对当前所存在的严重的数据孤岛问题的实际问题而给出的方案,从目前的现实情况看是合理的。然而,要建立真正合格的可信数据空间,就必须首先从根源上解决数据孤岛问题,要解决数据孤岛问题就需要创立新的软件理论体系。若还是以现有的软件理论体系建立可信数据空间,那么,其结果肯定是又产生了大量的数据孤岛。
在建立可信数据空间时,最忌讳的就是把“数据转换”当作可信数据空间必须包含的功能。或者说,在建设可信数据空间时,一定不能包含“数据转换”功能;凡是包含“数据转换”功能的可信数据空间肯定是仅适用于特定的小范围的数据孤岛型可信数据空间。
针对目前存在的数据孤岛问题,“数据转换”只是数据供需双方自己协商解决的,不是可信数据空间所必须有的功能,可信数据空间的功能应是“身份认证、数据流通、记录数据流通痕迹”;这犹如互联网,互联网只提供通信线路,数据的供需双方要传输什么样的数据、传输多少数据,则由数据的供需双方决定。在数据流通中,可信数据空间只是负责数据的原样传输,即,数据供方发送什么样的数据,可信数据空间就发送什么样的数据,并把数据传输给数据需方,并保持数据与数据供方的数据完全一样。数据需方通过可信数据空间接收到数据之后对数据的处理不属于可信数据空间的工作内容,应是由数据供需双方自己协商解决。
1.5.5“到2028年,建成100个以上可信数据空间”的目标是很难实现的
《计划》提出“到2028年,建成包含100个以上可信数据空间”,这个目标非常大,基本上是不可能完成的。
2028年之前,只能完成可信数据空间第一阶段的建设(统一的身份认证、统一的数据流通工具)。可信数据空间的第二阶段建设(统一的身份认证、统一的数据流通工具、统一的数据识别)涉及到对现有的各种信息系统及数据进行大规模的升级改造,这需要十年以上的时间,具体原因如下:
数据孤岛之所以是IT业老大难,是因为现有的软件系统及其数据都是有问题的,软件系统中的“数据”与软件系统又是密切耦合的。当前的软件系统中的“数据”只能称作是“代码”,并不是真正的“数据”,当前的“数据”一旦脱离了原来的系统,就成了其它软件系统不可识别的“代码”。例如,关系数据库中的数据是最终用户不能直接识别的,需要用软件解读之后才能成为最终用户能识别的数据。
在企业数据加入可信数据空间的建设中,会涉及到供应链中数百万家以上的企业及其ERP系统。企业数据中最关键的数据就是企业ERP系统中的采购单、销售单、财务数据;然而,这些数据在不同企业的ERP系统中的结构、数据内容、代码等各不相同,要想使这些数据在数百万个以上的ERP之间互联互通,还需要对这些企业的ERP系统及数据进行升级改造,相应的工程量是非常巨大的,相应的投资也是非常高昂的,也需要十年以上的时间才有可能初具规模。
结论:若不对现有的大量的信息系统及其数据进行升级改造而建立可信数据空间,肯定是非常片面的!肯定会出问题,肯定还是数据孤岛。可信数据空间建设的第一阶段是比较容易实现的,可信数据空间建设的第二阶段是非常难的,需要十年以后才能成规模。