KNN算法 实战一 ,电影类型分类

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

爱情片与动作片分类的实战

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

KNN实现电影类型分类

import matplotlib.pyplot as plt
import numpy as np
#第一步,构建数据集
fight=(3,2,1,101,99,98)  #x轴为电影中出现打斗的次数
kiss=(104,100,81,10,5,2) #y轴为电影中出现接吻的次数
filmtype=(1,1,1,2,2,2)  #电影类型标签1为爱情片,2为动作片,3为未知
plt.scatter(fight,kiss,c=filmtype) #c是颜色
plt.xlabel('fight')
plt.ylabel('kiss')
plt.title('movie')

x=np.array([fight,kiss])
x=x.T #转置,保证每一行是一个样本
y=np.array(filmtype) #样本输出
print(x)
print(y)

#第二步 计算未知样本和每个训练集样本的举例
xx=np.array([18,90])
dist=(((x-xx)**2).sum(1))**0.5  #计算欧式距离
print(dist)

#第三步 将距离升序排序
sortedDist=np.argsort(dist)
print(sortedDist) #输出的是排序的索引

#第四步 选取距离最小的k个点,统计前k个点所在类别出现的次数
k=4
classCount={}#定义空的字典  他的key是电影类别的标签,值是出现的次数
for i in range(k): #循环k次
    voteLabel=y[sortedDist[i]] #看看是爱情片还是动作片
    classCount[voteLabel]=classCount.get(voteLabel,0)+1  #原值0 +1

print('class:count',classCount)

#第五步,多数表决,输出结果
maxType=0
maxCount=-1
for key,value in classCount.items(): #for 循环遍历字典
    if value>maxCount:
        maxType=key
        maxCount=value #出现类别最多的次数
print('output:',maxType)#输出出现次数最多的类别




plt.show()
plt.close()

封装KNN

import numpy as np

#inX-未知样本 测试集
#dataSet 训练集
#labels 训练集分类标签向量
#k 选择距离最小的k个点
def knn(inX,dataSet,labels,k):
    dist=(((dataSet-inX)**2).sum(1))**0.5
    sortedDist=dist.argsort()
    classCount={}
    for i in range(k):
        voteLabel=labels[sortedDist[i]]
        classCount[voteLabel]=classCount.get(voteLabel,0)+1

    maxType=0
    maxCount=-1

    for key,value in classCount.items():
        if value>maxCount:
            maxType=key
            maxCount=value

    return maxType

调用KNN

import matplotlib.pyplot as plt
import numpy as np
import 封装KNN函数 as K
#第一步,构建数据集
fight=(3,2,1,101,99,98)  #x轴为电影中出现打斗的次数
kiss=(104,100,81,10,5,2) #y轴为电影中出现接吻的次数
filmtype=(1,1,1,2,2,2)  #电影类型标签1为爱情片,2为动作片,3为未知
plt.scatter(fight,kiss,c=filmtype) #c是颜色
plt.xlabel('fight')
plt.ylabel('kiss')
plt.title('movie')

x=np.array([fight,kiss])
x=x.T #转置,保证每一行是一个样本
y=np.array(filmtype) #样本输出
print(x)
print(y)

#第二步 计算未知样本和每个训练集样本的举例
xx=np.array([18,90])

result=K.knn(xx,x,y,4)
print('result:',result)
  • 2
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值