The Open Provenance Model Core Specification (v1.1)

开放源模型核心规范(v1.1)

论文背景

开放的种源模型是一个设计来满足以下要求的种源模型:
(1)允许通过基于共享种源模型的兼容性层在系统之间交换种源信息。
(2)允许开发人员构建并共享在这样的源模型上运行的工具。
(3)以一种精确的、与技术无关的方式定义起源。
(4)支持以数字方式表示任何“物品”的来源,无论该“物品”是否由计算机系统生产。
(5)允许多层次的描述并存。(6)定义一组核心规则,用于识别可以在起源表示上做出的有效推论。
本文档包含了开放来源模型(v1.1)的规范,这是社区为在来源挑战系列中实现互操作性而做出的努力。

简介

在艺术或数字库的背景下,来自艺术或数字图书馆的来源,其中它分别是指艺术对象的记录历史,或者数字对象生命周期中的过程文档[1]。 “电子科学界”[2]的出处的兴趣也在增长,因为物质被认为是工作流系统的重要组成部分[3],可以帮助科学家确保其科学分析和流程的可重复性。在此背景下,在芝加哥举行的国际货源和注释研讨会(IPA W’06)于2006年5月举行,涉及关于数据出处,流程文件,数据派生和数据注释问题的大约50名与会者[4,5 ]。在出现标准化的会议期间,共识开始出现,从而需要出处研究界需要了解更好的不同系统的能力,他们用于出处的陈述,他们的差异以及激励其设计的理由。
因此,第一次出处挑战诞生,从一开始就是挑战,被设定为信息,而不是竞争力。第一次出处挑战旨在为社区提供一个论坛,了解不同的出处系统的能力和其源代理的表现。参与者模拟或运行功能磁共振成像工作流程,它们从中实现并执行了预先确定的“出处查询”。十六队对挑战作出反应,并报告了他们在期刊特别问题[6]的经验[6]。第一次出产挑战之后是通过交换出处信息来建立系统的互操作性。十三个队[7]回应了这一第二次挑战。讨论表明就核心核心代表性有很大的协议。因此,在2007年8月的盐湖城研讨会之后,将数据模型制成和释放为开放原子能模型(V1.00)[8]。

这项工作的起点是由数英里的社区协议[9]。我们假设对象的出处(数字或非数字是否)由注释的因果图表示,这是一种定向的非循环图,其富有捕获与执行有关的进一步信息的注释。出于本文的目的,来源图被定义为作为过去执行(或当前执行)的记录,而不是将来可能发生的东西的描述。 2008年6月,二十名参与者参加了第一个OPM研讨会[10]讨论OPM规范V1.00。研讨会和建议[11]的几分钟发布,并导致了开放地区型号的V1.01 [12],这在第三个出处挑战期间积极使用,该挑战旨在交换OPM中编码的原子生物信息并回答精确来源查询。大约15支队伍参与了这一第三次挑战,并决定采用OPM的治理[13]的开源模型。提出了一系列提案,公开审查,并投票[14];结果是我们在本文中存在的开放源模型的1.1版。

要求

开放式源模型(OPM)是一种旨在满足以下要求的出种型号:
•允许基于共享出处模型的兼容层在系统之间交换的出处信息。
•允许开发人员建立和共享在此类出处模型上运行的工具。
•以精确的,技术不可知的方式定义出差。 •为了支持任何“东西”的出差数字表示,无论是由计算机系统生产的。
•允许多个级别的描述共存。
•定义一组核心规则,该规则识别可根据物质表示可以制定的有效推论。
在指定此模型时,我们也有一些非要求:
本文档的目的不是指定系统必须在内部储存和操纵出处的内部陈述;系统仍然可以自由选择适合其目的的内部表示。
本文档的目的不是为此模型定义计算机解析的语法;在单独的文档中指定XML中的OPM,RDF或其他OPM。
•我们未指定在出处存储库中存储此类派别信息的协议。
•我们未指定查询出处存储库的协议。

基础

开放式源模型允许我们阐述引起“事物”的原因,即“事物”如何取决于他人并导致特定国家。从本质上讲,它由表达这些依赖项的定向图组成。我们在这里介绍这种图的组成部分。

我们主要关注的是能够代表如何“事情”,是否仿真结果,诸如汽车的物理物体,或诸如决策之类的非物质实体,如给定状态,具有给定的特征,在一个特定的时刻。人们认识到,许多这样的“事情”可以是有状态:汽车可能在各个地方,它可以包含不同的乘客,它可以有一个充分或空的罐;同样,文件可以包含在其存在的不同时刻的不同数据。因此,从出处的角度来看,我们将文物的概念介绍为国家的不可变化;同样,我们介绍了一个过程的概念,作为新工件导致的动作。通常在某些上下文中进行过程,这使得能够或促进其执行:这种上下文的示例变化,并且包括该过程执行的地方,控制过程的单独的单独,或者赞助该过程的机构。这些实体被称为代理商。代理商,当我们讨论因果关系依赖性时,我们将看到,是发生的过程的原因(类似于催化剂)。开放式源模型基于这三种节点,我们现在定义。
定义1(文物)。可以在物理对象中具有物理实施例的不可变状态,或计算机系统中的数字表示。
定义2(过程)。由工件或由伪影引起的行动或一系列行动,导致新的伪像。
定义3(代理人)。作为过程催化剂的上下文实体,支持、促进、控制或影响过程的执行。

开放出处模型是一个过去的人工制品模型,解释了它们是如何产生的。同样,过程也发生在过去,即它们已经完成了它们的执行;此外,进程当前可能仍在运行(即,它们可能尚未完成执行)。在任何情况下,OPM都不打算描述未来工件的状态和未来过程的活动。为了便于理解和促进共享的视觉表示,我们引入了起源图的图形符号。具体来说,工件用椭圆表示;流程用矩形图形表示;最后,代理由八边形表示。

OPM

**开放起源模型旨在捕捉工件、过程和代理之间的因果依赖关系。**因此,起源图被定义为有向图,其节点是工件、过程和代理,其边属于图1中描述的下列类别之一。边缘代表一种因果关系,在它的源头(表示结果)和它的终点(表示原因)之间。
在这里插入图片描述
开放源模型中的边缘:源是结果,目的是原因

定义4(因果关系)。因果关系由弧表示,表示弧的源(效果)和弧的目的(原因)之间存在因果依赖关系。
定义5(过程使用的工件)。从流程到工件的“已用”边缘是一种因果关系,旨在表明流程需要工件的可用性才能完成其执行。当几个工件通过多个“用过的”边连接到同一个过程时,该过程需要所有这些工件才能完成。
定义6(由过程生成的工件)。从一个工件到一个过程的“由”边是一个因果关系,意在表示该过程需要启动它的执行来生成工件。当几个工件通过多个“由”边连接到同一个过程时,过程必须已经开始,才能生成所有工件。
定义7(由流程触发的流程)。从流程P2to到流程P1to的边缘“被触发”是一种因果依赖关系,表示流程P1to能够完成需要流程P1to的开始。
定义8(从工件派生的工件)。从人工产物A2to人工产物A1“衍生”出的边是一种因果关系,它指示人工产物A1需要已经生成,才能生成A2to。与A2i相关联的状态依赖于与A1相关联的状态上A1or的存在。
定义9(由代理控制的过程)。从进程P到代理Ag的边缘“被控制”是一种因果依赖关系,表明进程P的开始和结束由代理Ag控制。3.3.角色角色是“用过的”、“用过的”的组成部分
定义10(角色)。角色指定工件或代理在流程中的功能。

起源图定义

我们假设存在一些基本集合:流程、工件和代理、角色和帐户的标识符。这些标识符集合为给定起源图范围内的对应实体提供身份。给定的序列化将对这些集合进行标准化,并为它们提供具体的表示。必须强调的是,标识符的目的是定义图形的结构:它们并不意味着定义持久的、可随时间可靠解析的身份。开放出处模型是根据以下规则定义的
OPM实体可以是节点、边、角色、帐户或图形。2.帐户由唯一标识符标识。一个账户代表由一个或多个观察者提供的某种详细程度的描述。当且仅当两个帐户具有相同的标识符时,它们才相等。3.工件由唯一的标识符标识。工件是代表应用程序瞬时状态的实体。当且仅当两个工件具有相同的标识符时,它们才是相等的(与它们所代表的状态无关)。工件可以有选择地属于帐户:通过列出工件所属的帐户来声明帐户成员资格。4.流程由唯一标识符标识。流程代表应用程序活动。当且仅当两个进程具有相同的标识符时,它们才相等。进程可以选择属于帐户:通过列出进程所属的帐户来声明帐户成员身份。5.代理由唯一标识符标识。代理代表控制流程的上下文实体。当且仅当两个代理具有相同的标识符时,它们才是相等的。代理可以选择属于帐户:通过列出代理所属的帐户来声明帐户成员身份。6.边缘由其来源、目标和角色(对于包含角色的边缘)来标识。边缘表示它们的来源(结果)和目的(原因)之间的因果依赖关系。根据图1,源和目标由工件、过程或代理的标识符组成。边缘也可以选择性地属于帐户:帐户成员资格是通过列出边缘所属的帐户来定义的。结构等式适用于边:两个“使用”类型的边。如果它们具有相同的来源、相同的目的地、相同的角色和相同的帐户,则“由……生成”或“由……控制”是相等的;类型的两条边是从(resp。如果它们具有相同的来源、相同的目的地和相同的帐户,则它们是相等的。角色的含义不是由OPM定义的,而是由应用程序域定义的;OPM只在语法上使用角色(作为“标签”)来区分过程中工件和代理的参与。7.角色在边“已使用”、“由生成”和“由控制”中是强制性的。角色的意义是由它们所涉及的过程的语义来定义的。角色语义超出了OPM的范围。8.为了确保边缘在实际原因和结果之间建立因果联系,该模型假设如果一个边缘属于一个账户,那么它的来源和目的地也属于这个账户。换句话说,工件/过程/代理的有效帐户成员资格是其声明的帐户成员资格和与其相邻的边的帐户成员资格(即,它是的源和目的地)。9.如上所述,OPM图由工件、过程、代理、边和帐户组成。OPM图可能是断开的。OPM图可以通过使用结构等式进行比较。空集是一个OPM图。包含工件、过程或代理的单例是OPM图。在交和并运算6下,OPM图的集合是闭的,即两个OPM图的交是OPM图(对于并也是如此)。我们注意到,在这个阶段,语法上有效的OPM图从起源的观点来看不一定有意义。10.根据一个帐户的OPM图的视图,称为帐户视图,由这样的元素组成,其工件、过程和代理的有效帐户成员资格以及边的帐户成员资格包含该帐户。11.虽然循环可以用OPM的语法来表示,但是如果帐户视图没有“从”边的循环,并且如果它最多包含一个“由”每个工件的边生成的循环,则它是合法的。这确保了在一个账户中,OPM图捕捉到适当的因果依赖,并且给出了工件起源的单一解释。12.因此,合法的OPM图是所有帐户视图都合法的图。13.合法帐户视图是OPM图。两个合法帐户视图的结合是一个OPM图(它不一定是合法视图,因为它可能包含循环)。两个合法账户视图的交集就是一个合法账户视图。14.起源图不需要包含时间信息。15.边缘可以选择用时间信息来装饰(如图9所示)。在给定的帐户中,没有“被控制”边缘的进程也可以选择性地用时间信息来修饰。16.在一个账户内,时间信息必须与因果关系一致。为此,定义

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Nefelibat

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值