K-近邻算法的python实现

#1.构建数据集
import pandas as pd
rowdata={' 电影名称 ' : [ ' 无问西东 ' , ' 后来的我们 ' , ' 前任 3 ' , ' 红海行动 ' , ' 唐人街探案 ' , ' 战狼 2 ' ] , ' 打斗镜头 ' : [ 1, 5 , 12 , 108,112,115] , ' 接吻镜头 ' : [ 101,89,97,5,9,8] , ' 电影类型 ' : [ ' 爱情片 ' , ' 爱情片 ' , ' 爱情片 ' , ' 动作片 ' , ' 动作片 ' , ' 动作片 ' ] }
movie_data= pd.DataFrame(rowdata)
#2.计算距离
new_data = [24,67] 
dist = list((((movie_data.iloc[:6,1:3]-new_data)**2).sum(1))**0.5) 
#3. 将距离升序排列, 然后选取距离最小的 k 个点
dist_l = pd.DataFrame({'dist' : dist, ' labels' : (movie_data.iloc[:6, 3] ) }) 
k=4
dr = dist_l.sort_values(by = 'dist')[: k]
#4. 确定前 k 个点所在类别的出现频率
re = dr.loc[: , ' labels'] . value_counts()
#5. 选择频率最高的类别作为当前点的预测类别
result = [ ] 
result.append(re.index[0])
print(result)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值