机器学习实验二——k-近邻算法实例（书上）

最新推荐文章于 2024-01-21 16:18:30 发布

VIP文章 SUGA没有R

最新推荐文章于 2024-01-21 16:18:30 发布

阅读量335

点赞数

文章标签：算法机器学习

本文链接：https://blog.csdn.net/qq_56451568/article/details/120682561

版权

一.k-近邻算法电影类别分类

参照：博客一

实现代码

import numpy as np
import operator


def knn(trainData, testData, labels, k):
    # 计算训练样本的行数
    rowSize = trainData.shape[0]
    # 计算训练样本和测试样本的差值
    diff = np.tile(testData, (rowSize, 1)) - trainData
    # 计算差值的平方和
    sqrDiff = diff ** 2
    sqrDiffSum = sqrDiff.sum(axis=1)
    # 计算距离
    distances = sqrDiffSum ** 0.5
    # 对所得的距离从低到高进行排序
    sortDistance = distances.argsort()

    count = {}

    for i in range(k):
        vote = labels[sortDistance[i]]
        count[vote] = count.get(vote, 0) + 1
    # 对类别出现的频数从高到低进行排序
    sortCount = sorted(count.items(), key=operator.itemgetter(1), reverse=True)

    # 返回出现频数最高的类别
    return sortCount[0][0]
trainData = np.array([[5, 8], [4, 1], [3, 3], [4, 4]])
labels = ['动作片', '动作片', '爱情片', '爱情片']
testData = [4, 2]
X = knn(trainData, testData, labels, 3)
print(X)

实验结果

二.手写识别系统

首先得有两个数据文件夹测试集和训练集（testDigits和trainingDigits里的数据要不一样），里面存放不同写法的数字。训练集中的数据作为训练样本，之后在测试集中检验

需要识别的数字已经用图像处理软件处理过。如下图所示，具有相同的像素和形状：都是32像素×32像素的黑白图像。黑白像素分别由0和1表示. 然后再转换成文本存储形式存储。例如，如下三张图是直接从TEXT文档中截取的数字0，1，2

最低0.47元/天解锁文章

SUGA没有R

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习实验二——k-近邻算法实例（书上）

一.k-近邻算法电影类别分类参照：博客一实现代码import numpy as npimport operatordef knn(trainData, testData, labels, k): # 计算训练样本的行数 rowSize = trainData.shape[0] # 计算训练样本和测试样本的差值 diff = np.tile(testData, (rowSize, 1)) - trainData # 计算差值的平方和 sqr
复制链接

扫一扫