9.7 核方法与核函数总结

Debugging 我的人生

于 2025-05-18 21:26:43 发布

阅读量615

点赞数 16

分类专栏：数学基础文章标签：人工智能机器学习算法概率论学习

本文链接：https://blog.csdn.net/Leroi64/article/details/148028550

版权

95 篇文章

订阅专栏

核函数的核心是通过隐式高维映射解决低维空间中的非线性问题，避免显式计算高维内积的维度灾难。其数学本质可概括为：
$K(\mathbf{x}_i, \mathbf{x}_j) = \phi(\mathbf{x}_i) \cdot \phi(\mathbf{x}_j)$

底层逻辑：
当数据在低维空间线性不可分时（如环形或螺旋分布），核函数通过映射到高维空间（如多项式核映射到 $C (n + d, d)$ 维、高斯核映射到无限维）实现线性可分，而实际计算仍保持在低维完成，复杂度从 $O(n^d)$ 降为 $O (n)$ 。

数学形式：
$K(\mathbf{x}_i, \mathbf{x}_j) = (\mathbf{x}_i^\top \mathbf{x}_j + c)^d$
设计原理：
- 阶数 $d$ 控制特征交叉复杂度（如 $d = 2$ 捕捉二次交互项）， $c$ 平衡低阶与高阶项权重。
- 过拟合风险： $d > 5$ 时易受噪声干扰（如文本分类中的罕见词组合）。
计算优化：
显式计算高维内积需 $O(n^d)$ 时间，核技巧将其降为 $O (n)$ （ $n = 1000, d = 3$ 时运算量从 $10^9$ 降至 $10^3$ ）。

数学形式：
$K(\mathbf{x}_i, \mathbf{x}_j) = \exp\left(-\frac{\|\mathbf{x}_i - \mathbf{x}_j\|^2}{2\sigma^2}\right)$
核心特性：
- 带宽参数 $\sigma$ 控制决策边界平滑度（ $\sigma \to 0$ 过拟合， $\sigma \to \infty$ 退化为线性核）。
- 通用逼近能力：可表示任意连续函数（通过傅里叶变换与再生核希尔伯特空间理论）。
应用限制：
大数据场景效率低（ $n=10^4$ 时复杂度 $O(n^2)$ ，比线性核慢 $10^3$ 倍）。

作用：控制模型复杂度与过拟合风险。
- $\lambda=0$ 时退化为普通最小二乘法（过拟合风险高）。
- $\lambda=0.1$ 可抑制权重膨胀（如金融风控中防止异常值主导模型）。

多项式核：
- $d$ 增大增强特征交互能力，但需配合L2正则化（如SVM中 $C = 0.1$ ）防止维度爆炸。
高斯核：
- $\sigma$ 调优需网格搜索（如 $\sigma=median(\|\mathbf{x}_i-\mathbf{x}_j\|)$ 平衡局部与全局特征）。

核函数就像“数学魔术师”：

线性核：直接拿数据做计算，像用直尺画线分割红蓝弹珠——简单快速，但只能切直线。
多项式核：像乐高积木拼高阶特征，比如用“温度×节假日”组合预测奶茶销量。但拼太高（ $d = 5$ ）容易塌（过拟合）。
高斯核：像吹气球把数据托到空中分层，用低维距离计算完成高维分割。吹气力度 $\sigma$ 太小（局部过拟合）或太大（全局欠拟合）都不行。
参数调优：好比炒菜火候，火太大（ $\sigma$ 太小）会焦，盐太多（ $\lambda$ 太小）齁嗓子，食材乱搭（ $d$ 太大）味道怪，关键在平衡。