KNN基础算法原理和推导

最新推荐文章于 2024-07-17 08:10:50 发布

Mrrunsen

最新推荐文章于 2024-07-17 08:10:50 发布

阅读量1.6k

点赞数

分类专栏： Python系列专栏文章标签：算法机器学习分类

本文链接：https://blog.csdn.net/Mrrunsen/article/details/121954720

版权

Python系列专栏专栏收录该内容

116 篇文章 9 订阅

订阅专栏

基础算法原理和推导

KNN

2-2-1 Knn建模流程是怎样的？

（1）根据给定的距离度量，在训练集 $T$ 中找出与 $x$ 最邻近的 $k$ 个点，涵盖这 $k$ 个点的邻域记作 $N_k(x)$ ；

（2）在 $N_k(x)$ 中根据分类决策规则（如多数表决）决定 $x$ 的类别 $y$ ：
$y=\arg \max _{c_{j}} \sum_{x_{i} \in N_{k}(x)} I\left(y_{i}=c_{j}\right), \quad i=1,2, \cdots, N_{i} \quad j=1,2, \cdots, K$
在上式中， $I$ 为指示函数，即当 $y_{i}=c_{j}$ 时为1，否则为0

2-2-2 Knn优缺点是什么？

knn优点：

理论成熟，思想简单，既可以用来做分类又可以做回归
KNN是一种在线技术，新数据可以直接加入数据集而不必进行重新训练
可用于非线性分类（数据集不要求线性可分）
和朴素贝叶斯之类的算法比，对数据没有假设，准确度高，对异常点不敏感

knn缺点：

计算量大，尤其是数据集非常大的时候
样本不平衡的时候，对稀有类别的预测准确率低
KD树，球树之类的模型建立需要大量的内存
k值大小的选择很重要

2-2-3 Knn适合什么样的场景和数据类型？

通常最近邻分类器使用于特征与目标类之间的关系为比较复杂的数字类型，或者说二者关系难以理解，但是相似类间特征总是相似。

数据要求归一化，统一各个特征的量纲。
2-2-4 常用的距离衡量公式都有哪些？具体说明它们的计算流程，以及使用场景？

特征空间 $\mathcal X$ 是n维实数向量空间 $\mathbf{R}^n$ ， $x_i,x_j\in \mathcal{X}, x_i = (x_i^{(1)}, x_i^{(2)},\cdots x_i^{(n)} ), x_j = (x_j^{(1)}, x_j^{(2)}, \cdots, x_j^{(n)})$ 。则 $x_i,x_j$ 的 $L_p$ 距离（闵可夫斯基距离）定义为

$L_p(x_i, x_j) = (\sum_{l=1}^n |x_i^{(l)}-x_j^{(l)}|)^{\frac{1}{p}}$

这里 $p \geq 1 $。

1.欧式距离

当 $p = 2$ 时，称为欧氏距离，强调数值上的绝对误差

是严格定义的距离，满足正定性、对称性、三角不等式
$L_2(x_i, x_j) = (\sum_{l=1}^n |x_i^{(l)}-x_j^{(l)}|)^{\frac{1}{p}}$
2.曼哈顿距离（p=1）
$L_1(x_i, x_j) = \sum_{l=1}^n |x_i^{(l)}-x_j^{(l)}|$
3.切比雪夫距离（ $\infty$ ），各个坐标距离数值差的绝对值的最大值
$L_{\infty}(x_i, x_j) = \mathop{\max}_{l} \ |x_i^{(l)}-x_j^{(l)}|$
4.马氏距离

考虑各个分量（特征）之间的相关性并与各个分量的尺度无关。给定一个样本集合 $X$ ， $X=(x_{ij})_{m\times n}$ ，其协方差矩阵记为 $S$ 。样本 $x_i$ 与样本 $x_j$ 之间的马氏距离 $d_{ij}$ 定义为
$d_{ij} = [(x_i - x_j)^TS^{-1}(x_i - x_j)]^{\frac{1}{2}}$
当 $S$ 为单位矩阵时，即样本数据的各个分量互相独立且各个分量的方差为1时，马氏距离就是欧氏距离。

汉明距离

两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数

1011101 与 1001001 之间的汉明距离是 2。

2143896 与 2233796 之间的汉明距离是 3。

“toned” 与 “roses” 之间的汉明距离是 3。

5.相关系数（correlation coefficient）

相关系数的绝对值越接近1，表示样本越相似；越接近0，表示样本越不相似。

$x_i$ 与 $x_j$ 之间的相关系数定义为
$r_{ij} = \frac{\sum_{k=1}^{m}\left(x_{k i}-\overline{x}_{i}\right)\left(x_{k j}-\overline{x}_{j}\right)}{\left[\sum_{k=1}^{m}\left(x_{k i}-\overline{x}_{i}\right)^{2} \sum_{k=1}^{m}\left(x_{k j}-\overline{x}_{j}\right)^{2}\right]^{\frac{1}{2}}}$