对于线性可分数据集,支持向量机就是找距离正负样本都最远的超平面,相比于感知机,其解是唯一的,且不偏不倚,泛化性能好
支持向量机利用拉格朗日对偶将其转化成凸优化问题
- 并不是只有这一种方法可以实现转换成凸优化,只是这里选用了拉格朗日方法来实现
核函数:
在现实任务中,原始样本空间内也许并不存在一个能够正确划分两类样本的超平面,对这样的问题,可将样本从原始空间映射到一个更高维的特征空间,使得样本在这个特征空间内线性可分。
经验:文本数据通常使用线性核,情况不明时尝试高斯核
参考笔记
对于线性可分数据集,支持向量机就是找距离正负样本都最远的超平面,相比于感知机,其解是唯一的,且不偏不倚,泛化性能好
支持向量机利用拉格朗日对偶将其转化成凸优化问题