自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 PM4py 二开记录(7) :discover_dfg

在一个DFG图中,每个节点表示一个活动,其中的边表示活动之间的直接跟随关系。搭配特殊的 filter 可以调整输出结果:(例子中 展示了 1、2 两种)

2024-03-24 22:17:51 324

原创 PM4py 二开记录(6) :get_events_distribution log中挖掘足迹模型

推断日志/模型的任何两个活动之间的关系。

2024-03-23 23:10:11 205 2

原创 PM4py 二开记录(5) :get_events_distribution 使用柏拉图观察活动数量-时间分布, 及其他观察角度

有五种展示图标。

2024-03-23 21:16:22 167 1

原创 PM4py 二开记录(4) case_overlap_get: 计算与caseA 起止时间有重叠的case 的数量

case_overlap_get 计算与caseA 起止时间有重叠的case 的数量(含caseA自己)。可以快速区分出较为复杂的案例(case)

2024-03-20 14:22:57 294 1

原创 PM4py 二开记录(3) cycle_time_get : 累计每笔log 的开始与结束时间差(秒)

log 需要有两个时间戳(开始和结束时间), 累计每笔log 的开始与结束时间差(秒), 再除以总比数就是cycle_time 了, 但是这个方法只计算总时间差。比较适用于计算某个特定 event 的平均处理时间。start_timestamp_key 参数, 计算不出值。这只API 本身不支持。

2024-03-20 08:58:58 338 1

原创 PM4py 二开记录(2) 挖掘 变体流程中两个事件之间的时间聚合(秒, 平均??)

(例如,同一变体的所有事例的平均值) - 案例内路径的累积出现次数(例如, 第一个 A->B 将与 0 相关联,and the second A->B would be associated to 1)每行都与不同的列相关联: - 变体 - 位置(在变体中) - 源活动(路径) - 目标活动(路径) - 两个活动之间的时间聚合。将按变体和位置(在变体内部)聚合的 Pandas 数据帧关联到日志对象的方法。

2024-03-05 12:03:25 357 1

原创 PM4py 二开记录(1) 挖掘数据出流程的变体

将事件日志拆分为每个进程变体的子数据帧。结果是变体和子数据帧的迭代器。

2024-03-05 08:47:47 388

原创 PM4py 二开记录(摘要)

ProM 功能齐全,使用难度3颗星 ,功能很强大。但是在用实际数据90M 2000个case 不到, 系统资源就不够用,常常做到一半就要放弃。试用了 Disco,ProM 两个工具, disco 上手简单使用难度1颗星,但是功能比较少,可以给外行demo。3. 基本挖掘需求(continue .... )计划完成一个基于PM4Py 的小型应用。原始log 筛查利用1支 .py 完成。1. csv 转XES。

2024-03-05 08:41:07 400

打包文件 watchdog

打包文件111

2024-05-21

PM4py 二开记录(1)

开发测试数据

2024-03-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除