过程挖掘(Process Mining)1——始于颜值

写在最前面:能力有限,各位看客对过程挖掘系列文章有任何问题和建议请留言或私信,非常感谢!

过程挖掘是什么?

按照过程挖掘之父Wil van der Aalst 的说法,他定义的过程挖掘(PM,Process Mining)是从现有事件日志中挖掘知识以发现、监控和改进实际流程。

根据这个定义,我们关注其中两个名词——事件日志和实际流程。

不难理解,事件日志是实际流程成千上万次执行的记录,这是提供给过程挖掘的粮食,是驱动过程挖掘的能量,是过程挖掘理念产生的重要缘由。

实际流程这个概念用得很好,实际流程就是真实世界中,有别于人类脑海中构建的、概念上设计的流程,实际流程中的执行实例是更贴合真实的流程,更具客观性并且可以表达各种可能。

过程挖掘与业务流程管理的关系?

业务流程管理(BPM,Business Process Management)是一门结合各种理论和方法,以设计,执行,控制,测量和优化业务流程为目的的学科。

可以从BPM生命周期来了解BPM大致是做什么的,BPM以业务流程为中心,因此其生命周期的活动是围绕流程模型的生命周期的,从图中可以看出是对流程模型的持续性监控、处理和优化。

BPM生命周期

 

BPM生命周期各阶段说明
阶段说明
(重)设计设计一个流程,在重设计时是开始BPM生命周期的一次迭代。
配置/实现模型被实现为一个可运行的系统。
启动/监控当运行系统可支持设计的流程时,则流程系统可被启动和监控。
调整仅一些预定义的控制被加入或重配置到流程中,以调整流程的正确运行。
诊断/需求发现流程错误,或者因为流程环境的改变而需要引入新需求。

从BPM的视角和PM的特点来看,根据上图BPM生命周期,由于PM以数据为中心,可以说PM能在BPM生命周期中的启动/监控结点和诊断/需求阶段发挥作用。实际上,原本的BPM是模型驱动的方法,并没有把隐藏在数据中的知识考虑到流程模型中,直到现在BPM社区才开始意识到与数据相关的启动/监控、调整和诊断/需求阶段的重要性,数据驱动也成了BPM的一个重要特性,可以说PM在BPM可以发挥重要甚至关键的作用了。

虽然说PM在业务流程中可以发挥很大的作用,但是PM并不局限于BPM,PM是从实际流程的事件日志中挖掘信息和知识,因此任何记录事件信息的流程都可以考虑使用PM。实际上,现在PM的研究在行为模型上(人类行为、软件行为)都发现有很好的发挥作用。

过程挖掘与数据挖掘的关系?

从数据中发现隐藏的知识和信息是数据挖掘的目标,从这一点上,过程挖掘从事件日志中挖掘实际流程的潜在知识和信息,可以把过程挖掘归类为数据挖掘。然而,很多数据挖掘方法并没有对实际流程的事件日志进行挖掘的研究,因此过程挖掘弥补了这一缺口。

值得注意的是,从过程挖掘的定义来看,过程挖掘并没有限定你使用什么方法,只要是对实际流程的事件日志挖掘知识和信息,不管你是用过程发现(PD,Process Discovery)算法、一致性检验(CC,Conformance Checking),还是用决策树算法、关联规则分析等,都可以说你是在过程挖掘。因此,过程挖掘确实就是数据挖掘在流程层面的数据上的应用,当你打算在流程数据上做分析,或者你的工作本身就是与流程和流程数据打交道,过程挖掘的方法和数据挖掘的方法都是值得学习和使用的。

管理学还是计算机科学?

上面介绍了PM与BPM、DM的关系,可以说PM既有管理学的属性,由于计算机科学(或者说数据科学)的属性,但是应该从特定的角度来决定这样的关系。实际上,与DM一样,PM也是在设计、实现和分析某个应用来发挥作用的。比如一个企业需要对其内部的某个产品的某个流程启动过程挖掘分析,从设计上需要决定使用哪些数据?从流程的哪个抽象层次切入?数据的利用要在哪个粒度层面上?使用哪些工具、方法和算法?为了解决什么问题等等等等;从实现上比如数据的处理、工具的配置、算法的实现等等;从分析上就是对挖掘的结果进行分析,指出结果为这家企业带来了什么信息?能否引出新的PM问题?有什么产品或者产品流程的缺陷等等。因此一个PM项目可能涉及到很多领域(管理学、流程科学、计算机科学等),需要各种人员的参与(管理员、流程分析师、计算机人员、PM专家、数据分析师、决策者等等)。

实际上,流程科学的不断发展,从静态流程到动态流程,到运行时分析,再到数据驱动,其目的是提高生产力,方法也不断在进步,并且在各种领域上发挥了重要进步。过程挖掘是流程科学的最新发展结果,并且已经发挥了很大的作用,在流程优化上已经被证明是高效的方法。在西方,流程科学在企业中是重要的研究内容,企业内部存在各种类型的流程(产品流程、管理流程等),其在企业生产力的提高上发挥了很大的作用。在我国,流程科学已经开始得到越来越多的重视了,各种企业不得不把BPM引入,高校中信息系统不断优化升级,可以很明显看出逐渐把流程科学化了,中国的产业升级离不开产业流程的优化,流程科学化是重要的工作,相信不管是BPM还是PM,它们作为高效的流程优化工具,必然在中国开花结果。

 

 

后面的内容:介绍PM的基本内容,主要是PM的要素、方法,其三大方向的全面介绍,现阶段重点在于实现PM而不在于应用PM。会介绍一些PM的最新研究进展。关于PM的应用,后面会写一点。

                     PM介绍的内容主要来自Wil van der Aalst大佬的Process Mining Data Science in Action Second Edition,作为一次学习总结过程。本书可以在Springer上下载。

                     关于BPM,介绍阅读的书:Fundamentals of Business Process Management ,同样可以在Springer上下载

                     数据挖掘方法网上已经有很多内容不多推荐

                     关于PM的应用,可以关注比赛BPIC https://icpmconference.org/2020/bpi-challenge/

                    

 
  • 8
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Process mining是一种通过分析和挖掘系统中的实际操作数据来揭示和改进业务流程的方法。CSDN是一个技术博客和资源分享平台,下面将介绍使用CSDN平台上的Process mining工具包的使用。 首先,在CSDN平台上可以找到一些流行的Process mining工具包,如ProM、Disco和RapidMiner等。在使用这些工具包之前,我们需要确保正确安装它们,并根据需要进行配置。 其次,通常需要准备用于分析的操作日志数据。这些数据可以是来自各种系统的日志文件,也可以是数据库中的数据。将操作日志数据导入到Process mining工具包中是非常重要的一步。 接下来,使用Process mining工具包进行数据预处理。这包括数据清洗、过滤和转换等步骤,以确保数据的可靠性和一致性。此外,还可以对数据进行分段,以便更精确地分析特定的业务流程。 然后,通过选择适当的分析算法,可以使用Process mining工具包对数据进行探索和分析。这些算法可以帮助我们发现潜在的问题、瓶颈或无效的操作,从而改进业务流程。 最后,使用Process mining工具包生成可视化和报告。这些可视化和报告可以帮助我们更好地理解和解释分析结果,并与他人共享我们的发现。通过可视化,我们可以更直观地展示业务流程中的一些关键指标和路径,以及改进的建议。 总而言之,Process mining工具包是帮助我们进行业务流程分析和改进的重要工具。在这些工具包中,我们可以找到各种功能强大的算法和工具,以帮助我们挖掘实际操作数据中隐藏的有价值信息,并提供有关如何改进业务流程的建议。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值