DBSCAN 密度聚类

本文介绍了DBSCAN密度聚类算法在金融机构和电商团伙套现问题上的应用。DBSCAN能处理任意形状的数据集,尤其适用于非凸簇,且无需预设簇数。在Python实现中,通过调整eps参数,将经纬度扩大100倍以适应距离计算,设定邻域半径200米和最少样本数3。聚类结果可用于风险评估和后续处理。
摘要由CSDN通过智能技术生成

DBSCAN 密度聚类算法:

具体数学解释及算法见 DBSCAN 密度聚类算法, 本文主要进行实践。

背景:

对于金融机构或者电商来说,常常面临团伙套现问题。具体来说,欺诈团伙在电商利用无息(或低息)购物贷款大量购买商品,并在其他平台出售从而完成套现。对于金融机构来说,此类行为占用了大量的资金。

DBSCAN 的特性及适合性

  • DBSCAN 可以对任意形状的稠密数据集进行聚类(凸和非凸均可),套现团伙在地理位置上常常表现为非凸(现实社区形状不规则,可能出现互相嵌套的情况)。
  • DBSCAN 不需要事先指定聚类中心数目(Kmeans 需要), 这点也适合于我们预先不知道该地区可能团伙数目的情况。

Python 实现

  • 导入需要的包
import os
import pandas as pd
import numpy as np
from sklearn.cluster import DBSCAN
  • 导入数据
addr_lon = pd.read_csv('test.csv', engine = 'python')

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值