读取“客户价值.xlsx”,使用Axes3D绘制反映RFM数据列关系的3D散点图。
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
df = pd.read_excel('某超市的销售数据.xlsx')
df = df.dropna() # 删除缺失值
df1 = df[['顾客编号', '销售金额', '销售日期','数据采集时间']]
df1['R']=(pd.to_datetime(df1['数据采集时间'])-pd.to_datetime(df1['销售日期'])).values/np.timedelta64(1,'D')
df1=df1[['顾客编号', '销售金额', '销售日期','R']]
df2=df1.groupby('顾客编号').agg({'R':'min','销售金额':'mean'})
df2['F']=df1.groupby(['顾客编号'])['顾客编号'].size()
df2.to_excel('data.xlsx',index=False)
datafile=r'data.xlsx'
transformfile=r'tfdata.xls'
data=pd.read_excel(datafile)
data=data[["R",'F','销售金额&