4.2KNN实例1--python机器学习

最新推荐文章于 2024-08-20 11:45:32 发布

**码上人生**

最新推荐文章于 2024-08-20 11:45:32 发布

阅读量978

点赞数

分类专栏： python机器学习文章标签： python机器学习 KNN算法

本文链接：https://blog.csdn.net/qq_16365849/article/details/52233756

版权

python机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

例子（电影分类）：

电影名称	打斗次数	接吻次数	电影类型
California Man	3	104	Romance
He’s Not Really into Dudes	2	100	Romance
Beautiful Woman	1	81	Romance
Kevin Longblade	101	10	Action
Robo Slayer 3000	99	5	Action
Amped II	98	2	Action
未知	18	90	Unknown

这个数据用打斗次数和接吻次数来界定电影类型，接吻多的是Romance类型的，而打斗多的是动作电影。现在有一部名字未知的电影，打斗次数为18次，接吻次数为90次的电影（这里名字未知是为了防止能从名字中猜出电影类型），它到底属于哪种类型的电影呢？

# -*- coding: utf-8 -*-
"""
Created on Wed Aug 17 18:57:36 2016

@author: aijun
"""

import numpy as np
from sklearn import neighbors

knn = neighbors.KNeighborsClassifier() #取得KNN分类器

#data对应着打斗次数和接吻次数
data = np.array([[3, 104], [2, 100], [1, 81], [101, 10], [99, 5], [98, 2]])

#labels则是对应Romance和Action
labels = np.array([1,1,1,2,2,2])

#导入数据进行训练
knn.fit(data, labels)

#预测
knn.predict([18, 90])
knn.predict([100, 2])

array([1])

array([2])

说明：

首先，用labels数组中的1和2代表Romance和Aciton，因为sklearn不接受字符数组作为标志，只能用1,2这样的int型数据来表示，后面处理可以将1和2映射到Romance和Action上来。fit则是用data和labels进行训练，data对应的是打斗次数和接吻次数构成的向量，称之为特征向量。labels则是这个数据所代表的电影所属的类型。调用predict 进行预测，将未知电影的特征向量代入，则能分析出该未知电影所属的类型。此处计算结果为1,也就是该未知电影属于Romance，和直觉相符。