【数据挖掘】分类之kNN

最新推荐文章于 2023-06-18 11:33:00 发布

浅唱书令

最新推荐文章于 2023-06-18 11:33:00 发布

阅读量7.6k

点赞数 3

分类专栏：人工智能

本文链接：https://blog.csdn.net/keyboardlabourer/article/details/23781985

版权

人工智能专栏收录该内容

45 篇文章 8 订阅 ¥19.90 ¥99.00

订阅专栏

1.算法简介

kNN的思想很简单：计算待分类的数据点与训练集所有样本点，取距离最近的k个样本；统计这k个样本的类别数量；根据多数表决方案，取数量最多的那一类作为待测样本的类别。距离度量可采用Euclidean distance，Manhattan distance和cosine。

用Iris数据集作为测试，代码参考[1]

import numpy as np
import scipy.spatial.distance as ssd

def read_data(fn):
    """ read dataset and separate into characteristics data
        and label data
    """
 
    # read dataset file
    with open(fn)

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

浅唱书令

关注关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
3
评论
【数据挖掘】分类之kNN

1.算法简介knn的思想挺简单的：计算待分类的数据点与训练集所有样本点，取距离最近的k个样本；统计这k个样本的类别数量；根据多数表决方案，取数量最多的那一类作为待测样本的类别。距离度量可采用Euclidean distance，Manhattan distance和cosine。用Iris数据集作为测试，代码参考[1]import numpy as npimpor
复制链接

扫一扫