K近邻算法之电影分类(二)

分类过程

  1. 数据准备阶段
    • 读取数据
    • 特征抽取
    • 数据切割
  2. 数据的训练
  3. 数据的测试
  4. 数据的模拟

sklearn调用API进行电影分类

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
# 1.数据准备阶段
# 1.1 读取数据
m = pd.read_excel('tests.xlsx',sheet_name=0)

# 1.2.特征抽取 Feature 特征部分  Labels(target) 目标
# Feature 必须是一个二维的数据类型 Label至少是一维的
fea = m.iloc[:,1:-1]
lab = m.iloc[:,-1]

# 1.3.数据切割 训练集 测试集
# int 测试数据有几条
# float 测试数据的比例
x_train,x_test,y_train,y_test = train_test_split(fea,lab,test_size=.3)
# 2.数据的训练
# n_neighbors = k 找几个距离自己最短的邻居
# p = 2 使用欧式距离作为度量
# n_jobs 开启几个进程
knn = KNeighborsClassifier(n_neighbors=5,p=2,n_jobs=1)

# 进行训练
knn.fit(x_train,y_train)

# 进行评估 观测模型的准确率
knn.score(x_train,y_train)
# 3.数据的测试
knn.score(x_test,y_test)
# 4.模型的模拟
# 'hi bye mama'
new = np.array([(3,17)])

# 预测
knn.predict(new)

输出:
array([‘爱情片’], dtype=object)

sns.scatterplot(x='武打镜头',y='接吻镜头',data = m,hue='分类情况')
sns.scatterplot(x=new[:,0],y=new[:,1])

在这里插入图片描述

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值