python-时序频繁项集挖掘 prefixspan

一、项目需求

某金融信贷场景下,探索违约客户在时序上行为的共通性,以此来对客户违约进行提前识别。

二、方案设计

项目需求是在已收集客户的基本信息及历史行为数据,在客户进行分类 0 好客 1 坏客基础上,挖掘坏客违约之前行为的共性。业务上理解就是在一个人发生违约之前有哪些表现,如:大额/多笔消费性支出、信贷展期、多次申请信贷。这些表现是否存在组合特征、时序上是否有前后关联。

整体方案:圈选客户群体,构建客户画像和事件集,进行频繁项集和时序频繁项集挖掘,比较好坏客户群里间频繁项集的差异性来评估该频繁项集表现(简单理解就是,一个业务上认为有效的事件组合应该是在坏客户中出现占比较高,而在好客户群众中出现占比低),筛选出有通共性和区分性较高的事件序列。

三、实施步骤

1、坏客定义

坏客定义为发生逾期超过90天的客户。

2、构建事件集

通过客户基础信息和在行流水数据、业务办理等,外部采购数据等,构建用户层级画像并设计事件库。事件库的设计偏向用户行为或者状态的改变,如:当月发生大额消费性支出(>10万),当月消费性支出环比增长500%,连续3个月月末存款余额低于1000元。

3、时序频繁序列挖掘

        a. 构建事件序列

        b. 对事件序列进行筛选

        c. 时序频繁项挖掘

4、效果评估

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值