自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 地址转为经纬度通过DBSCAN进行关联识别

地址是风控中很关键的字段,但是地址文本难以精确或模糊匹配,无法进行有效关联风险识别。在信用卡团办代办邮寄地址异常、审计业务的关联交易识别、电商平台供应商和客户的联合欺诈,门店注册地址、经营地址、送货地址、发票地址的异常识别……诸多方面均需要读懂地址。曾经经历的一起欺诈风险案件,AB相识,共同作案,伪冒下单的A,办公地址距离B竟然不到300米。我们发现了A,但是过了一段时间才把B挖出来,忽略了收货地址的深度分析,导致损失扩大。...

2022-06-14 09:25:09 1441 2

原创 pandas 求区间的交集

分析,先将区间表示出来,实现上可以用interval,不过更方便的是借助portion库:pip install portion。如上图,a=[12,19],b=[5,18],c=[19,20],需求为求两两之间的交集范围,返回交集的区间。这样就完成了实现了需求。

2022-10-28 16:11:49 654 1

原创 异常订单分析之地址分布异常——python经纬度距离聚类应用

异常在哪儿呢?举例来说,目标客群是面向C端提供服务的便利店,但是看售卖数据发现这些门店都聚集在批发市场附近。出现在了不该出现的地方。经纬度标记来帮您 。

2022-06-28 09:45:43 1468

原创 pandas 获取最大值对应列名

利用idxmax,获取最大值对应的行索引。而通过设置axis=1,可返回最大值对应的列名。

2022-06-24 17:00:48 2906

原创 挖掘重复评论-DBSCAN文本聚类实战

利用DBSCAN算法可以方便地对批量交易、团伙作案加以挖掘,结合文本特征提取,可以对淘宝、京东、大众点评、汽车论坛等平台上面海量的评论进行聚类,挖掘刷评论用户、发现商品评价的典型意见……

2022-05-24 15:38:57 778 2

原创 商户异常下单之休眠启用检测

无论B端还是C端,当客户长期休眠后突然动用贷款或赊销额度,都需要予以预警并分析交易的真实性。通过python分析客户在不同休眠时长下的启用情况。

2022-05-23 13:04:56 303 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除