作者:张建军,中国电科首席专家,神州网信技术总监
本文约7100字,建议阅读10+分钟
本文主要介绍数据与数据分类、数据确权规则、数据的所有权与其他权利等方面内容,并进行案例分析。
2022年12月发布的《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)提出了需要“构建数据基础制度”,而数据确权、价值评估、流通监管是建立数据制度的三个基本问题。为分析这三个问题,需要建立一个理论模型和分析方法,并在此基础上,提出基本的确权规则、流通规则、入表规则和监管方法,目的是为前述三个问题的分析和解决提供一种在法律、经济和技术上逻辑清晰的架构和方法,推动相关问题的落地解决。
本文是系列文章的第一篇——数据与确权。
先说结论:按照现代信息系统的基本工作机理,数据是指有一定结构和含义的二进制数字集合;数据可以分为指令类数据和非指令类数据;非指令类数据可以进一步分为:原始数据(次原始数据),模型数据,结论类数据,自动执行类数据。依据数据的分类和数据处理的特点,对非指令类数据提出数据所有权确权的4条规则:
确权规则一:原始数据(次原始数据)中完全取决于实体本身的属性、状态,逻辑上不依赖特定数值化活动的数据属于对应的主体(被数值化的主体或物的拥有者);原始数据中依赖于特定数值化活动的数据,属于对应主体和实施数值化活动的主体,数据可以去关联后分属相关主体。
确权规则二:主体(人或机构)的原始数据(及次原始数据)的所有权无法改变,但可以设置类似“用益物权”的权利;物的原始数据(次原始数据)的所有权随物的所有权变化而变化;数据集按照“按份共有”的原理确定权属。
确权规则三:结果数据的权属在遵守规则一、二的前提下,可依照《民法典》“添附”规定确定权属(或权益)的归属,默认属于输入数据所有者和处理者共同。
确权规则四:新产生的模型数据、统计/推测/预测结论、研判/决策结论、自动执行数据按照规则三确权,后续可以改变。
一、数据与数据分类
现代信息系统都是基于现代数字计算机技术构建的,因此计算机体系的特点决定信息系统中数据的特点,因此后面的讨论中不在区分信息系统和计算机系统。
在现代计算机系统中只有二进制的数。人们设计这些系统时,赋予了这些二进制数一定的结构(即:数的排列方式)和含义(即:编码规则),这些有结构和含义的二进制数字集构成为数据。
数据基本可以分为两大类,即:指令类数据和非指令类数据。
指令类数据就是直接控制电子开关工作的数据。计算机系统就是通过指令实现基本的四则运算、逻辑判断的。
计算机里面除了指令类数据之外都是非指令类数据。
编程人员按照一定的处理逻辑,编排计算机的各种指令,就构成为“计算机程序”。计算机程序是“指令类数据”最主要的形式。
现代信息系统与现实世界的关系可以抽象为如下模型:
数据存在于“赛博空间”中,“赛博空间”是一个“人造”空间,现实空间与赛博空间的交互,本质仍是人与世界的交互作用,这一特性决定了赛博空间的所有规律