数据溯源-标注方法

数据溯源
标注法,反向查询法,数据追踪方法。双向指针追踪法,位向量存储定位

数据溯源:data provenance / datatracing

数据溯源技术最常见的一种算法就是标注法[49],标注法主要是给数据做一定的标记信息,将标注添加到原始数据之外的地方。一旦发生泄漏事件,可以在不干扰原始数据使用的前提下起到溯源作用。标注是保留原始数据的同时,引入附加数据,标注中可以记载着数据的来源以及数据的完整演变过程标注类似于商品的标签,在流转过程中标签是随着商品一起流转的,而标注信息也是随着数据进行流转。在数据发生泄漏以后,通过查看数据的标注信息可以确定出泄漏的源头。DBNotes,Annotea.BioDAS,Annotea是W3C领导下的一个项目,它致力于用语义网络的技术来管理Web上的标注,Annotea管理的标注与Web文档是分离的,当Web文档在转移的时候,标注并不会变,除非用户明确地编辑标注,因而不存在标注的传播等问题,显然这不能满足数据起源研究的需要。BioDAS是一个管理基因序列数据的标注系统,该项目也是为了使得研究人员可以更好地共享标注信息,并没有记录其起源信息。文献[13]代表了标注管理研究的当前水平,该文介绍了一
种基于关系的管理标注的数据模型,其中每个数据项(属性)都带有标注,当数据在转移的时候,标注能够随着数据一起转移。在实现时,该系统将标注和其他数据一起存储,目前只包含最简单的信息,每个属性都有一个附加的“虚拟”列用于存储这些标注。这种
存储模式的问题是冗余比较大,而且事实上要求修改关系模式,这在很多情况下是不可能的。并且只支持属性粒度上的标注。

数字版权保护、检测、药物试验、企业财务和国家情报等领域

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
Prov数据溯源模型是一种用于描述数据来源、数据处理和数据输出之间关系的标准化模型,它可以帮助我们更好地理解数据的来源和处理过程。下面是Python实现Prov数据溯源模型的一些基本步骤: 1. 安装prov库 在Python中,我们可以使用prov库来实现Prov数据溯源模型。可以使用以下命令安装prov库: ``` pip install prov ``` 2. 创建Prov实例 我们需要创建一个Prov实例来表示数据处理过程。可以使用以下代码创建一个Prov实例: ``` from prov.model import ProvDocument prov = ProvDocument() ``` 3. 添加实体(Entity) 实体(Entity)是Prov数据溯源模型中的基本元素,它表示数据的来源或输出。我们可以使用以下代码添加一个实体: ``` prov.entity('ex:Data', {'ex:name': 'example data'}) ``` 其中,ex:Data是实体的标识符,{'ex:name': 'example data'}是实体的属性。 4. 添加活动(Activity) 活动(Activity)表示对数据的处理过程。我们可以使用以下代码添加一个活动: ``` prov.activity('ex:Process', startTime='2019-01-01T00:00:00Z', endTime='2019-01-01T01:00:00Z') ``` 其中,ex:Process是活动的标识符,startTime和endTime分别表示活动的开始时间和结束时间。 5. 添加关系 我们可以使用以下代码添加实体和活动之间的关系: ``` prov.wasGeneratedBy('ex:Data', 'ex:Process') ``` 其中,wasGeneratedBy表示实体被活动生成,'ex:Data'是实体的标识符,'ex:Process'是活动的标识符。 6. 保存Prov实例 最后,我们可以使用以下代码将Prov实例保存到文件中: ``` with open('example.prov', 'w') as f: prov.serialize(f) ``` 以上就是Python实现Prov数据溯源模型的基本步骤。通过使用prov库,我们可以方便地创建和管理Prov数据溯源模型。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Nefelibat

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值