PHM_DVL-CSDN博客

原创 PM4py 二开记录(7) ：discover_dfg

在一个DFG图中，每个节点表示一个活动，其中的边表示活动之间的直接跟随关系。搭配特殊的 filter 可以调整输出结果：（例子中展示了 1、2 两种）

2024-03-24 22:17:51 324

原创 PM4py 二开记录(6) ：get_events_distribution log中挖掘足迹模型

推断日志/模型的任何两个活动之间的关系。

2024-03-23 23:10:11 205 2

原创 PM4py 二开记录(5) ：get_events_distribution 使用柏拉图观察活动数量-时间分布, 及其他观察角度

有五种展示图标。

2024-03-23 21:16:22 167 1

原创 PM4py 二开记录(4) case_overlap_get：计算与caseA 起止时间有重叠的case 的数量

case_overlap_get 计算与caseA 起止时间有重叠的case 的数量（含caseA自己）。可以快速区分出较为复杂的案例(case)

2024-03-20 14:22:57 294 1

原创 PM4py 二开记录(3) cycle_time_get ：累计每笔log 的开始与结束时间差（秒）

log 需要有两个时间戳（开始和结束时间），累计每笔log 的开始与结束时间差（秒），再除以总比数就是cycle_time 了，但是这个方法只计算总时间差。比较适用于计算某个特定 event 的平均处理时间。start_timestamp_key 参数，计算不出值。这只API 本身不支持。

2024-03-20 08:58:58 338 1

原创 PM4py 二开记录(2) 挖掘变体流程中两个事件之间的时间聚合（秒，平均??）

（例如，同一变体的所有事例的平均值） - 案例内路径的累积出现次数（例如，第一个 A->B 将与 0 相关联，and the second A->B would be associated to 1)每行都与不同的列相关联： - 变体 - 位置（在变体中） - 源活动（路径） - 目标活动（路径） - 两个活动之间的时间聚合。将按变体和位置（在变体内部）聚合的 Pandas 数据帧关联到日志对象的方法。

2024-03-05 12:03:25 357 1

原创 PM4py 二开记录(1) 挖掘数据出流程的变体

将事件日志拆分为每个进程变体的子数据帧。结果是变体和子数据帧的迭代器。

2024-03-05 08:47:47 388

原创 PM4py 二开记录（摘要）

ProM 功能齐全，使用难度3颗星，功能很强大。但是在用实际数据90M 2000个case 不到，系统资源就不够用，常常做到一半就要放弃。试用了 Disco，ProM 两个工具， disco 上手简单使用难度1颗星，但是功能比较少，可以给外行demo。3. 基本挖掘需求(continue .... )计划完成一个基于PM4Py 的小型应用。原始log 筛查利用1支 .py 完成。1. csv 转XES。

2024-03-05 08:41:07 400

打包文件 watchdog

打包文件111

2024-05-21

PM4py 二开记录(1)

开发测试数据

2024-03-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人