- 博客(8)
- 收藏
- 关注
原创 PM4py 二开记录(7) :discover_dfg
在一个DFG图中,每个节点表示一个活动,其中的边表示活动之间的直接跟随关系。搭配特殊的 filter 可以调整输出结果:(例子中 展示了 1、2 两种)
2024-03-24 22:17:51 324
原创 PM4py 二开记录(5) :get_events_distribution 使用柏拉图观察活动数量-时间分布, 及其他观察角度
有五种展示图标。
2024-03-23 21:16:22 167 1
原创 PM4py 二开记录(4) case_overlap_get: 计算与caseA 起止时间有重叠的case 的数量
case_overlap_get 计算与caseA 起止时间有重叠的case 的数量(含caseA自己)。可以快速区分出较为复杂的案例(case)
2024-03-20 14:22:57 294 1
原创 PM4py 二开记录(3) cycle_time_get : 累计每笔log 的开始与结束时间差(秒)
log 需要有两个时间戳(开始和结束时间), 累计每笔log 的开始与结束时间差(秒), 再除以总比数就是cycle_time 了, 但是这个方法只计算总时间差。比较适用于计算某个特定 event 的平均处理时间。start_timestamp_key 参数, 计算不出值。这只API 本身不支持。
2024-03-20 08:58:58 338 1
原创 PM4py 二开记录(2) 挖掘 变体流程中两个事件之间的时间聚合(秒, 平均??)
(例如,同一变体的所有事例的平均值) - 案例内路径的累积出现次数(例如, 第一个 A->B 将与 0 相关联,and the second A->B would be associated to 1)每行都与不同的列相关联: - 变体 - 位置(在变体中) - 源活动(路径) - 目标活动(路径) - 两个活动之间的时间聚合。将按变体和位置(在变体内部)聚合的 Pandas 数据帧关联到日志对象的方法。
2024-03-05 12:03:25 357 1
原创 PM4py 二开记录(摘要)
ProM 功能齐全,使用难度3颗星 ,功能很强大。但是在用实际数据90M 2000个case 不到, 系统资源就不够用,常常做到一半就要放弃。试用了 Disco,ProM 两个工具, disco 上手简单使用难度1颗星,但是功能比较少,可以给外行demo。3. 基本挖掘需求(continue .... )计划完成一个基于PM4Py 的小型应用。原始log 筛查利用1支 .py 完成。1. csv 转XES。
2024-03-05 08:41:07 400
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人