[合规性检查方法-Precision3]基于对齐的精确度计算方法

Wil van der Aalst于2012年提出了基于对齐(Alignment)的精确度计算方法,该方法中介绍了拟合度、精确度、泛化度和简单度四种质量维度的指标计算方法,下面我们将详细介绍精确度这一指标的计算方法。

1.背景介绍

   前面部分我们已经介绍过基于对齐的拟合度计算方法,详情见 https://blog.csdn.net/qq_40420514/article/details/125424149,接下来我们将介绍基于对齐的精确度计算方法。

      精确度指标的提出是为了避免模型欠拟合(Underfitting)。计算精确度的前提是假设任何模型M是确定性的,即给定一些执行序列\sigma \in \beta (M),模型M中只有一条对应的路径。换句话说,在模型中不能有两个具有相同标签的使能变迁。

2.方法思想

       为了简化精度的定义,我们将事件日志视为唯一事件\varepsilon的集合。此外,我们定义了以下函数e∈ \varepsilon和一些模型M=(S,S_I,S_F,A_M,T)

start_M(e)\in S是在事件e发生之前M中的状态。请注意,由于我们考虑了拟合度为1的预处理日志和确定性模型,因此可以导出该状态。

context_L(e)\in A_M*是事件e发生之前流程实例的活动前缀,即事件e之前发生的所有活动的序列。我们将此前缀称为e的上下文。

en_M(e)\subseteq A_M是在start_M(e)中使能的活动集,即en_M(e)={a\in A_M|\exists s\in S(state_M(e),a,s)\in T}.

en_L(e)\subseteq A_M是在同一上下文中执行的一组活动,即en_L(e)={act(e')|e'\in\varepsilon\wedge context_L(e')=context_L(e)}.其中en_L(e) \subseteq en_M(e),因为我们仅针对拟合度为1的事件日志和确定性模型(相同的前缀总是导致相同的状态)。

 

        每个事件e∈ \varepsilon隐式地指在执行E之前事件日志中的一个点。对于该点,我们可以计算模型en_M(e)中使能活动的数量以及在类似上下文en_L(e)下实际执行的观察活动的数量。这可用于定义以下精度概念:

 

        如果实际观察到模型允许的所有行为,则precision(L,M)=1。通过计算所有事件的平均值,我们自动将频率考虑在内。如果模型有一个在频繁路径上启用的活动,但该活动从未执行,则这比沿不频繁路径启用的未使用活动更严重。

3.经典示例

 可以根据上述定义计算得出,

precision(L,M1)= 0.97,  precision(L,M2)=1;

precision(L,M3)=0.41,   precision(L,M4)=1

 4.工具实现

该方法已作为插件在ProM6 中实现,插件名为“Measure Precision/Generalization”。

 

 

 参考文献:

Van der Aalst W, Adriansyah A, van Dongen B. Replaying history on process models for conformance checking and performance analysis[J]. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 2012, 2(2): 182-192.

如需进行相关的了解或者交流,欢迎私信或者加入QQ群:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

北冥有鱼zsp

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值