使用k-means及k-prototype对混合型数据集进行聚类分析
1. 分析目标本项目旨在使用聚类算法对110个城市进行分类与排序,以寻找客观真实的城市分层方法、支持业务运营与决策。2. 数据集数据集来源于某互联网公司,特征值标签已做脱敏处理。数据集尺寸为111行×5列,第一行为标题行,其余110行为实例。第一列:城市名,将作为index不参与模型计算; 第二列:特征值a,以数值表现的分类变量,1代表评价最好、4代表最差; 第三列:特征值b,数值型变量,数值越高对业务积极影响越大; 第四列:特征值c,数值型变量,数值越高对业务消极影响越大; 第五列
原创
2020-06-15 03:22:47 ·
9207 阅读 ·
10 评论