实战项目:KNN算法进行车辆满意度测评
选用经典的Car Evaluation Database数据集
通过对六个特征值进行测评,得到用户对车辆的满意程度
数据集来源于下面的网站:http://archive.ics.uci.edu/ml/index.php
计算测试数据相对于测试集中每一组数据的距离,并且根据k值来选取最近的K的个数据,并且统计k个数据中,出现次数最高的结果,作为测试数据的结果
选取文本中10%的数据进行测试,进行数据归一化,读取二维数组的行数,确定测试的数量,记录错误数量的变量,通过KNN算法进行判断
coding=utf-8
“”"
KNN算法进行车辆评测
“”"
from numpy import *
import operator
#数据处理
#数字化处理
def KeyToNum(line):
#将一行的字符串变成对应的数字
numline = []
switcher = {
‘vhigh’ : 4 ,
‘high’ : 3 ,
‘med’ : 2 ,
‘low’ : 1 ,
‘5more’ : 5 ,
‘more’ : 6 ,
‘small’ : 1 ,
‘big’ : 3 ,
‘unacc’ : 1 ,
‘acc’ : 2 ,
‘good’ : 3 ,
‘vgood’ : 4 ,
}
for key in line:
numline.append(switcher.get(key, key))
return numline
#读数据集并保存到数组中
def filecarmatrix(