利用R语言中的KMEANS算法对业务中各类客户进行分析

本文介绍了使用R语言的KMEANS算法对业务中的客户进行分析的过程,包括数据导入、清洗、建模和作图。重点在于数据预处理,如处理缺失值,选择关键属性(入会时长、飞行次数、里程数、飞行里程、折扣系数),并进行标准化。通过雷达图展示聚类结果,强调了数据处理在数据分析中的重要性。
摘要由CSDN通过智能技术生成

利用R语言中的KMEANS算法对业务中各类客户进行分析

第一步,数据导入
这里截取部分数据的属性

setwd("C:\\Users\\admin\\Desktop\\R_sv")
datafile=read.csv("air_data.csv",header = T)

导入之后我们先通过summary函数来查看一下各变量的统计量。
发现其中部分数据存在缺失值,那么我们首先对缺失值进行处理。

第二步,数据清洗
缺失值的处理,去掉所有第一年和第二年票价为缺失值的所有行

delet_na<-datafile[-which(is.na(datafile$SUM_YR_1)| is.na(datafile$SUM_YR_2)),]
index<-(delet_na$SUM_YR_1==0&delet_na$SUM_YR_2==0)*(delet_na$avg_discount!=0) 
#返回0或者1
deletdata<-delet_na[-which(index==1),]                        

处理掉无价值客户的数据(票价为0,折扣不为0)

这里需要对我们要分析的数据属性做一个归类。样本数据来自某家航空公司,我们需要分析哪些客户需要保留,哪些值得开发,等等。
因此我们通过业务方面分析,从第一张图中属性选出以下五种:
L:入会时长
R:飞行次数

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值