-
SVM基本思想
- 寻找超平面
- 实现最大间隔
- SVM的形式化描述[熟悉书本]
- 支持向量:距离超平面最近的样本点
- 间隔:两个异类支持向量到超平面的距离和
- 对偶问题[熟悉书本表达式]
- SVM特点:最终的模型仅与支持向量相关.
- SMO求解对偶问题:每次优化两个参数,提高效率
-
核函数
- 用途
- 用高维空间使样本线性可分
- 在原始空间内计算样本在高维特征空间的内积
- 重要性:
- 核函数定义了一个高维空间
- 核函数的选择影响了SVM的性能
- 用途
-
软间隔
- 原因
- 完全线性可分的核函数很难找
- 即使线性可分也可能是过拟合
- 解决思路
- 引入允许出错的软间隔
- 用C控制弹性
- 原因
-
替代损失
- 原因:0/1损失函数非凸非连续
- 常用的替代损失函数
- hinge(常用)
- 指数
- 对率
-
对率替代损失函数的特点
- 近似得到对率回归
- 输出即得概率
- 可直接用于多分类
- 不能导出支持向量 开销较大
-
模型优化目标=结构风险+经验风险
- 结构分析=模型性质,在这里是间隔大小
- 经验风险=模型与数据的契合程度,在这里是软间隔弹性
-
SVR支持向量机回归
- 损失大于一定值才计算
- 形式[书本公式]
- 稀疏性
- SVR\SVM的模型总可以表为核函数的线性组合
- 最常见的核方法:引入核函数将线性学习器扩展为非线性.