K-近邻算法的python实现

最新推荐文章于 2024-02-07 15:31:38 发布

qq_37760746

最新推荐文章于 2024-02-07 15:31:38 发布

阅读量51

点赞数

分类专栏： python 机器学习文章标签：机器学习 KNN算法电影分类数据预处理欧氏距离

本文链接：https://blog.csdn.net/qq_37760746/article/details/120647805

版权

python 同时被 2 个专栏收录

20 篇文章 0 订阅

订阅专栏

机器学习

2 篇文章 0 订阅

订阅专栏

#1.构建数据集
import pandas as pd
rowdata={' 电影名称 ' : [ ' 无问西东 ' , ' 后来的我们 ' , ' 前任 3 ' , ' 红海行动 ' , ' 唐人街探案 ' , ' 战狼 2 ' ] , ' 打斗镜头 ' : [ 1, 5 , 12 , 108,112,115] , ' 接吻镜头 ' : [ 101,89,97,5,9,8] , ' 电影类型 ' : [ ' 爱情片 ' , ' 爱情片 ' , ' 爱情片 ' , ' 动作片 ' , ' 动作片 ' , ' 动作片 ' ] }
movie_data= pd.DataFrame(rowdata)
#2.计算距离
new_data = [24,67] 
dist = list((((movie_data.iloc[:6,1:3]-new_data)**2).sum(1))**0.5) 
#3. 将距离升序排列， 然后选取距离最小的 k 个点
dist_l = pd.DataFrame({'dist' : dist, ' labels' : (movie_data.iloc[:6, 3] ) }) 
k=4
dr = dist_l.sort_values(by = 'dist')[: k]
#4. 确定前 k 个点所在类别的出现频率
re = dr.loc[: , ' labels'] . value_counts()
#5. 选择频率最高的类别作为当前点的预测类别
result = [ ] 
result.append(re.index[0])
print(result)

qq_37760746

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
K-近邻算法的python实现

#1.构建数据集import pandas as pdrowdata={' 电影名称 ' : [ ' 无问西东 ' , ' 后来的我们 ' , ' 前任 3 ' , ' 红海行动 ' , ' 唐人街探案 ' , ' 战狼 2 ' ] , ' 打斗镜头 ' : [ 1, 5 , 12 , 108,112,115] , ' 接吻镜头 ' : [ 101,89,97,5,9,8] , ' 电影类型 ' : [ ' 爱情片 ' , ' 爱情片 ' , ' 爱情片 ' , ' 动作片 ' , ' 动作片 ' ,
复制链接

扫一扫