介绍除了贝叶斯统计和判别模型的两类方法外的其他分类方法:
• 1、近邻法
直接根据训练样本对新样本进行分类,是一种最简单的分段线性分类器:把各类划分为若干子类,以子类中心作为类别代表点, 考查新样本到各代表点的距离并将它分到最近的代表点所代表的类。
![298a7724c276738afff929c5817da569.png](https://img-blog.csdnimg.cn/img_convert/298a7724c276738afff929c5817da569.png)
决策规则:
已知样本集S = { , , = 1, ⋯ , } ,设有 个类别即 ∈{1, 2, ⋯ , } 。 定义样本之间的距离 , =∥ - ∥。 对未知样本 , 其与 的距离为
![b1378f59a2fb7ee77f4e03f427db1ad0.png](https://img-blog.csdnimg.cn/img_convert/b1378f59a2fb7ee77f4e03f427db1ad0.png)
则 ∈ 或 类,针对不同的应用, 距离 (⋅,⋅)有不同的定义。
k近邻法作为最近邻法(1近邻法) 的推广: 找出 的 个近邻, 看其中多数属于哪一类, 则把 分到哪一类。 近邻分类器中的 是一个重要参数, 当 取不同值时, 分类结果会有显著不同。 另一方面, 若采用不同的距离计算方式, 则找出的“近邻” 可能有显著差别, 从而也会导致分类结果有显著不同,k近邻(