这篇文章主要是记录下,我工作中用到的算法与模型的组合。
算是一种分析思路吧,顺便谈一下不足之处。
首先RFM模型大多数情况是用在高频消费场景,主要分析用户的最近购买时间,购买次数,以及购买金额。依据这三个指标可以对用户进行划分。例如零售业,顾客群体比较稳定,且客户的购买行为及频次相对固定,一个客户从前一礼拜购买数三次。如今只来一次,那么数据本身的反应就会很快。
但是在投资行业,本身投资周期分为长、中、短,分别对应了1年以内,1-5年,5年以上,用户的投资频率较低,投资金额较大,且最近投资时长可能在一个产品周期内只有一次。
因此本模型的适配性并不高,但是刨除长周期用户,仅仅分析短周期的投资订单,将时间维度拉长到年,获取一年内的用户投资RFM还是可以的。
有了数据以后,首先对数据进行清洗,刨除
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans,DBSCAN,Ag