机器算法之sklearn工具（KNN算法）

最新推荐文章于 2024-04-28 19:36:15 发布

只求毕业

最新推荐文章于 2024-04-28 19:36:15 发布

阅读量288

点赞数

本文链接：https://blog.csdn.net/qq_41514914/article/details/105724283

版权

这里写目录标题

KNN算法
代码示例

KNN算法

在这里插入图片描述

代码示例

电影类型分类

在这里插入图片描述

import numpy as np
from sklearn.neighbors import  KNeighborsClassifier
import pandas as pd
# 分类，电影类别
# 动作 武打镜头：碟中谍6 、杀死比尔
# 爱情 接吻镜头：泰坦尼克号
# 属性：武打镜头、接吻镜头
# 量化：数量化、数字化
movie=pd.read_excel('./movies.xlsx',sheet_name=1)
data=movie.iloc[:,1:3]
target=movie['分类情况']
# 算法，训练
knn=KNeighborsClassifier(n_neighbors=5)
# 训练，学习，算法，知道数据和目标值什么样的关系
knn.fit(data,target)
# 预测，使用，应用

X_test=pd.DataFrame({
   '武打镜头':[100,67,1],'接吻镜头':[3,2,15]})
Y_test=knn.predict(X_test)
print (Y_test)

#结果
['动作片' '动作片' '爱情片']

鸢尾花数据分类


import numpy as np
from sklearn.neighbors import KNeighborsClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
iris=load_iris()
x=iris['data']
y=iris['target']
# 150代表着150个样本，4代表着4个属性：花萼长、宽，花瓣长、宽；
print(x.shape)
# 将数据划分，一分为二，一部分用于训练，一部分用于测试
#x_train,x_test, y_train, y_test = train_test_split(x, y, test_size=0.25)
index=np.arange(150)
np.random.shuffle(index)
x_train,x_test=x[index[:100]],x[index[100:]]
y_train,y_test=y[index[:100]],y[index[100:]]
#n_neighbors为选取最近的邻居个数，
# weights表示每个邻居所占的权重，uniform表示每个邻居所占权重相同，distance表示距离越近权重越大
#p=1表示按照曼哈顿距离公式进行计算，p=2表示按照欧氏距离公式进行计算，默认=2
knn=KNeighborsClassifier(n_neighbors=5,weights='distance',p=2)
knn.fit(x_train,y_train)
y_=knn.predict(x_test)
print('预测值：'