【机器学习调包侠】K近邻聚类简明应用

最新推荐文章于 2023-08-22 09:05:17 发布

dingbaix

最新推荐文章于 2023-08-22 09:05:17 发布

阅读量236

点赞数 1

分类专栏：机器学习调参调包侠文章标签：机器学习数据挖掘 python

本文链接：https://blog.csdn.net/weixin_48963752/article/details/115314416

版权

本文介绍了如何利用Python和机器学习库sklearn进行K近邻聚类。通过对宏观消费数据的处理，依据cpi值创建了两类，并使用KNeighborsClassifier进行训练和预测。通过调整n_neighbors参数，观察不同邻居数对聚类效果的影响，并通过可视化展示结果。

摘要由CSDN通过智能技术生成

首先，调包+导入数据，并进行初步处理，本文使用宏观消费数据，并根据cpi值（以100为界限）将数据分为两类。
#####调包
import sklearn
import mglearn
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

#######数据处理
df = pd.read_excel(r’C:\Users\14852\Desktop\consumption data.xls’)
for i in range(0,29,1):
if df.loc[i,‘cpi’]<=100: ##将cpi替换为两类（可生成新类别）
df.loc[i,‘cpi’] = 1
elif df.loc[i,‘cpi’]>100:
df.loc[i,‘cpi’] = 0
else:
print(1)
y = np.array(df[‘cpi’])
X = np.array(df.iloc[:,0:2])
df

在这里插入图片描述
######聚类过程
from sklearn.neighbors import KNeighborsClassifier
clf = KNeighborsClassifier(n_neighbors = 3)
X_train = X[1:15,:]
y_train = y[1:15]
X_t

最低0.47元/天解锁文章

dingbaix

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【机器学习调包侠】K近邻聚类简明应用

首先，调包+导入数据，并进行初步处理，本文使用宏观消费数据，并根据cpi值（以100为界限）将数据分为两类。#####调包import sklearnimport mglearnimport pandas as pdimport numpy as npimport matplotlib.pyplot as plt#######数据处理df = pd.read_excel(r’C:\Users\14852\Desktop\consumption data.xls’)for i in rang
复制链接

扫一扫