原创 | 数据的确权、流通、入表与监管研究(四):数据与监管

本文探讨了数据确权、流通及监管的关键问题,基于《数据二十条》提出理论模型和方法,强调了数据安全包括信息安全和业务合规,并分析了数据流通的两面性及其风险。文章提出了四个数据监管思路,涉及现实化、数值化、建模类数据处理和数据流通的规范化,以及个人隐私保护的合规性规则。
摘要由CSDN通过智能技术生成

524b1a28df35917ee51db14d303afb0d.png

作者:张建军,中国电科首席专家,神州网信技术总监
本文约5500字,建议阅读11分钟
本文主要介绍数据的确权、流通以及监管的四个思路。

2022年12月发布的《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)提出了需要“构建数据基础制度”,而数据确权、价值评估、流通监管是建立数据制度的三个基本问题。为分析这三个问题,需要建立一个理论模型和分析方法,并在此基础上,提出基本的确权规则、流通规则、入表规则和监管方法,目的是为前述三个问题的分析和解决提供一种在法律、经济和技术上逻辑清晰的架构和方法,推动相关问题的落地解决。

本文是系列文章的第四篇——数据与监管。

先说结论:数据安全包含了传统信息安全和业务合规两方面的工作,不同语境下可能会有所侧重;原始数据的时空关联性和冗余性、信息技术提供的强大计算能力,造成了数据大规模流通会带来正反两方面效果;解决好大规模数据流通对传统敏感信息管控机制的挑战,是数据监管的基础性工作;防止“上帝视角”能力的滥用,是数据监管的核心工作。基于这些结论,提出监管思路:

思路1:严格监管现实化环节。

思路2:合理监管数值化环节和清洗/整理环节。

思路3:鼓励建模类数据处理。

思路4:规范数据流通。

最后提供一些基于上述思路的个人信息处理规则。

一、 数据安全与信息安全和业务合规

本文将数据安全与信息安全、业务合规的关系定义如下。

对信息系统的拥有者和运营者而言,数据安全工作包含了信息安全工作和业务合规工作。

信息安全工作是指保障系统中信息的机密性、完整性、可用性为目标的工作。信息安全工作开展是以信息安全风险管控为主要手段,涉及重要信息资产的识别、脆弱点/漏洞的及时发现和处理、技术措施的部署和完善、管理和运维体系的建立和完善、安全事件的及时发现和处置等方面。信息安全工作目标的另一种表述是确保信息系统不会因为自身的脆弱性/漏洞、外部的恶意攻击(包括技术性和社会学的攻击)对所支撑的核心业务造成不可接受的损失。

业务合规性工作则是指所开展的业务相关工作符合国家相关法律、法规的规定,遵守行业、市场的成熟规则,符合社会公德和伦理。现代信息技术是一个发展速度很快的领域,围绕技术进步所形成的新商业模式/业务模式层出不穷,相关的法律、法规、行业和市场规则存在滞后的情况,因此业务合规性工作是一个动态变化、不断演进的工作。

信息安全工作和业务合规性工作是在不同层面开展的工作。信息安全工作更多是站在企业自身的角度,以保护业务工作、防止来自信息系统的损害为核心目标。但企业的业务工作在不同阶段不一定都是合规合法的(或者说存在灰色的情况),尤其在新业务快速发展变化过程中更是如此。很多新业务都有这样的发展过程,业务初创,不存在合规性问题,业务发展过程中,暴露除一些问题,引发监管部门关注,而后出台相关规定予以规范,业务在一段时间内为满足相关的合规性要求对业务和信息系统进行整改,最终业务成熟稳步发展,同时相关法规也逐步完善,合规性工作进入常态。也就是说信息安全工作完全是配合业务工作而开展的,也是要遵从业务合规性的要求进行完善。业务合规性则要求企业根据社会公德与公平性、社会伦理的要求,主动或被动规范自身业务行为,以避免企业经营遭受风险和损失。

在没有数据大规模流通和交易的时,尤其在信息系统支撑传统业务开展的场景下,数据安全工作与信息安全工作是高度重合的,此时信息系统的作用更多是让传统业务的信息流转和处理更加高效,以扩大传统业务的规模、效率,降低成本。数据大规模流通和交易后,可能会带来对传统业务的革命性变化,创造新的业务模式,就会导致更多的合规性风险,此时的合规性工作就会成为数据安全不可或缺的重要内容。近期国家在数据安全领域出台的涉及个人信息、跨境数据流动的法规,就是为了规范相关的业务活动。这也是现在合规性成为数据相关企业非常重要工作的原因。

总结起来,数据安全应包括信息安全和业务合规两方面的工作。在不同的语境下,数据安全对两个方面的强调程度可能会有所差异,实际工作中需要认真辨别。

二、 数据流通的两面性及其风险

数据流通的正反两方面效果跟赛博空间数据产生和利用过程有密切关系,其中原始数据的时空关联性和冗余性,是造成这些效果的根本原因,而现代信息技术提供的强大计算能力则是另一原因。

现实空间实体对象因为业务的原因,在一定的时空点与特定信息系统发生交互,在系统中留下了原始数据。这些数据本来是为特定业务服务的,但这些数据的时空特性和冗余特性,会让不同信息系统的原始数据产生关联,在强大计算能力的支撑下,就可以发现更多的事实和规律,进而可以对现实空间产生正反两方面的影响。

原始数据的时空特性是由于数值化活动发生在一定的时间和空间坐标下而产生的。数值化活动是现实空间实体对象的特性、状态、关联关系映射进赛博空间的唯一环节,信息系统会以各种方式记录下相关数字化活动的时空信息,导致原始数据都会带有一定精度的时空信息。对不同信息系统而言,这些时空信息的精度是差异很大的,完全取决于业务对相关信息的需求。实体对象在现实空间中的运动是有时空规律的,而时空信息则会将实体在不同信息系统留下的原始数据关联起来,从而在赛博空间留下对应实体相对完整的、数值化的运行轨迹,这就为赛博空间后续的模型分析和数据开发利用奠定了基础。不同信息系统的时空特性精度可能差异很大,但不会影响时空关联的事实,只会影响关联的精度和准确度(即:是关联到一定规模的实体群还是单一的实体)。

原始数据的冗余度主要体现在两个方面。

一是指原始数据本身会存在一定的信息冗余,可以在原有业务需求之外,提供更多的状态、属性和关联关系的信息。例如:一幅包含主体人物活动和背景的数字化图像,除了可以提供主体人物当时的状态信息外,背景图像还可以提供从时间到空间等等非常多的信息;一段人的录音,从其背景声中也可以产生非常多的次原始信息;关于一段事实的自然语言陈述,也可以产生该事实发生时间、地点、与多个实体的关联等多种信息。

二是原始数据在不同信息系统中的信息冗余性。信息系统(尤其是传感器网络)的广泛部署和使用,让实体对象主动或被动地同时与多个信息系统进行了交互,在不同信息系统中留下了冗余的原始数据。例如:一人在街边行走,就可能同时在路边的交通视频监控系统、带摄像头的汽车自动驾驶系统、街边摄影爱好者的数码相机中留下数值化的图像;在商场完成的一次购物手机支付活动,就可能同时在店家的财务系统、商场的管理系统、移动通信系统、线上支付网关系统、银行系统中留下一系列的记录。

原始数据一旦汇集起来后,原始数据的冗余度不仅会大大提高原有数据的精度和准确度,还可以产生新的数据。

原始数据的时空特性让不同信息系统的数据可以关联起来,冗余性能够让次原始数据更加精确,在强大计算能力的支撑下,就可以建立更好的模型,从而对现实空间产生更加有效的影响。正面的影响是显然的,但也存在两方面的风险和挑战:

1) 大规模高精度原始和次原始数据的易得性对传统敏感信息管理的提出挑战。

如前面所说,信息系统的广泛部署,会在不同的信息系统中积累大量的精度差异很大的原始数据,但这些数据经大规模流通汇集后,因其具备时空性和冗余性,会产生高质量的次原始数据。这些次原始数据所包含的信息覆盖范围可能非常广,不仅仅是自然人,还会涉及大量的自然和人造资源、社会组织。在实体空间,以传统方式获取类似的信息可能需要很大的投入,且高精度的敏感信息会受到严格的收集和使用管控,因此大规模的数据流通(包括跨境流通)和使用就会对传统的敏感信息管理产生挑战。这一挑战产生的根本原因还是在IT技术的快速发展,为人和机构提供了更加高效的方法,以获取和认识现实空间实体运动状态和规律信息。正确处理这一挑战,是数据流通促进发展、避免安全风险的基础。

2)  “上帝视角”能力的滥用会带来对社会公平、伦理、经济和国家安全的严重威胁。

实体对象时空轨迹的高精度记录,在足够算力的支撑下,可以产生更好的模型。利用模型,可以在历史数据中发现更多的规律和事实,对实体对象未来的状态做出更准确的预测和判断。这一能力会随着技术的进步和数据的不断积累而不断提升和完善,这就很容易让人产生“上帝视角”的感觉。这一能力的正确使用,会带来积极的效益,但过度的使用就会对社会治理、公平、伦理,乃至经济和国家安全造成重大伤害。“上帝视角”能力是数据大规模流通和数据处理能力提升后的必然后果,如何让这一能力发挥积极作用,防止负面作用是数据监管的核心问题。

总结一下,解决好大规模数据流通对传统敏感信息管控机制的挑战,是数据监管的基础性工作;防止“上帝视角”能力的滥用,是数据监管的核心工作。

三、 数据监管思路

如《数据与确权》和《数据与交易》两文所述,在赛博空间内,数值化环节产生原始数据;原始数据经过清洗/整理环节,形成为更加全面和准确的次原始数据;原始数据和次原始数据经过建模环节,生成模型类数据;模型类数据在应用环节被用于对原始和次原始数据的处理,生成可现实化数据;可现实化数据通过现实化环节,对现实空间产生影响。上述过程构成了数据经济价值的传递链条。上述过程各环节既可以发生在一个组织内,也可能发生在不同组织间,从而形成了不同组织间的数据流通和交易。

从上述价值传递链可以看到,数据如果仅仅存在于赛博空间,对现实空的影响是非常小的,价值也是非常有限的。同时,如上一节所述,原始数据和次原始数据中的敏感部分管控和防止“上帝视角”能力的滥用,是监管的基础和核心问题。基于这两点,提出如下的监管思路:严格监管现实化环节、合理监管数值化环节和清洗/整理环节、鼓励建模类数据处理、规范数据流通。

监管思路1:严格监管现实化环节

现实化环节是数据影响现实世界的唯一环节,同时也是数据直接产生经济效益的环节,是相关企业新业务模式的最关键环节。此环节的监管应重点关注三个方面,即:对社会伦理、道德文化的负面影响,数据产生效益在相关主体之间分配的公平性,对社会运行、经济和国家安全的影响。此环节的监管措施的出台需要企业与相关部门的密切沟通,更需要相关部门的主动了解和科学分析企业业务需求的合理性和必要性,分析其对现实空间的影响。现实化环节的监管效果会是很高效的,但不科学的监管措施,很可能就会将数字经济发展的机会扼杀掉,让企业的大量投入浪费掉,大大增加数字经济和社会发展的成本。

监管思路2:合理监管数字化环节和清洗/整理环节

数字化环节和清洗/整理环节是原始数据和次原始数据的产生环节,此环节的最大风险存在于敏感信息的处理问题。如上一节所说,原始数据的时空性和冗余性在提高次原始数据的精度同时,也有可能将次原始数据的敏感度提高了,会与现实空间的敏感信息监管产生矛盾。因此监管可以有两个角度,一是对数值化环节和清洗/处理环节提出要求,适当控制原始数据的时空精度和数据冗余度;二是调整现实空间敏感信息监管规则,使其能够反应赛博空间原始数据和次原始数据的处理特点。最终实现原始数据的合规采集,安全汇集和处理,形成精度、范围合理的、安全合规的次原始数据,为进一步的数据处理奠定基础。此环节需要考虑:什么主体能够在什么情况下对什么实体进行什么方面和什么精度的数值化;如何处理原始数据中的时空信息和冗余信息;哪些主体能够对什么规模、什么范围、什么精度、什么内容的原始数据进行处理生成次原始数据;

监管思路3:鼓励模型类数据的生成,同时企业要自律,遵守基本道德和伦理的要求。

数字化模型是很多新业务模式的基础,也是很多领域创新成果的重要载体。模型类数据只要未用于现实化,或者未大规模的现实化使用,对现实世界的影响就非常有限,风险是完全可控的。因此针对模型类数据的生成和研究,从监管的角度应持积极鼓励的态度。模型类数据的研究和生成,有很多创新的成分,但可能会触及道德和伦理的底线,因此从事模型类数据开发的企业应以自律为主,要遵守基本的社会道德规范和伦理的要求。

监管思路4:规范数据流通。

赛博空间的各类数据有着不同的特性,其中:原始数据和次原始数据,会涉及一些敏感信息;一些模型会涉及伦理问题;特定的可现实化数据具有较大的经济价值等。这些特性会对数据流通的双方提出要求,需对相关的数据流通行为进行规范。原始数据和次原始数据流通会涉及到哪些主体之间能够流通多大规模、什么精度、什么内容的数据;对一些敏感的模型类数据应对流通范围予以规范。实际操作中,需要根据实体对象的情况、数据产生和使用的领域等,综合考虑相关的流通规则。

四、 个人隐私保护的合规性规则

基于前面提到的监管思路,针对个人隐私保护,对个人数据的处理提出如下的合规性规则供读者讨论:

规则1:未经个人授权不能以“上帝视角”对个人原始数据和次原始数据进行处理,包括但不限于:对过去状态的“推测性”追溯;基于”推测性“追溯做决策/研判;基于”推测性“追溯从原始数据和次原始数据中寻找证据;推测未来状态,并作决策;对包含个人信息的数据实施现实化。

规则1实际是对现实化数据的产生行为和现实化行为进行规范。未经授权,是不能利用各种模型去推测原始数据中没有的个人过去的状态信息(比如:健康状态、关联关系等),也不能推测未来的状态信息(比如:潜在的采购行为),更不能基于这些推测、预测信息产生决策数据,并进行现实化,造成对个人现实活动的影响。

规则2:涉及跨域的原始数据处理,需要个人同意和授权, 或相关跨域处理活动可追溯。

这是对原始数据的流通和处理提出的要求。很多个人向特定主体控制的信息系统提供数据,只是授权特定主体完成相关业务活动所需,原则上并不允许这些数据流出特定主体的控制范围。如果特定主体因为业务需要,确需将原始数据流转到其他主体控制的控制范围,同时也无法获得个人授权同意的,应提供追溯的手段,以确保相关个人数据在流转后的处理只用于满足了业务需要。

往期回顾:

原创 | 数据的确权、流通、入表与监管研究(一):数据与确权

原创 | 数据的确权、流通、入表与监管研究(二):数据与流通

原创 | 数据的确权、流通、入表与监管研究(三):数据与入表

编辑:于腾凯

校对:林亦霖

c8ad4a514daa20a02eff7bf1683b4a6a.png

  • 19
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值