机器学习——支持向量机

雷霆之王

于 2024-06-11 16:29:35 发布

阅读量960

点赞数 31

文章标签：机器学习支持向量机算法

本文链接：https://blog.csdn.net/m0_74739796/article/details/139600087

版权

一、支持向量机（SVM）概念

支持向量机（Support Vector Machine, SVM）是一类按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），其决策边界是对学习样本求解的最大边距超平面（maximum-margin hyperplane）

SVM使用铰链损失函数（hinge loss）计算经验风险（empirical risk）并在求解系统中加入了正则化项以优化结构风险（structural risk），是一个具有稀疏性和稳健性的分类器 [2]。SVM可以通过核方法（kernel method）进行非线性分类，是常见的核学习（kernel learning）方法之一 [4]。

二、背景

SVM被提出于1964年，在二十世纪90年代后得到快速发展并衍生出一系列改进和扩展算法，在人像识别、文本分类等模式识别（pattern recognition）问题中有得到应用 [5-6]。

SVM是由模式识别中广义肖像算法（generalized portrait algorithm）发展而来的分类器，其早期工作来自前苏联学者Vladimir N. Vapnik和Alexander Y. Lerner在1963年发表的研究。1964年，Vapnik和Alexey Y. Chervonenkis对广义肖像算法进行了进一步讨论并建立了硬边距的线性SVM 。此后在二十世纪70-80年代，随着模式识别中最大边距决策边界的理论研究、基于松弛变量（slack variable）的规划问题求解技术的出现，和VC维（Vapnik-Chervonenkis dimension, VC dimension）的提出，SVM被逐步理论化并成为统计学习理论的一部分。1992年，Bernhard E. Boser、Isabelle M. Guyon和Vapnik通过核方法得到了非线性SVM 。1995年，Corinna Cortes和Vapnik提出了软边距的非线性SVM并将其应用于手写字符识别问题，这份研究在发表后得到了关注和引用，为SVM在各领域的应用提供了参考。

三、支持向量机概述图

四、支持向量机内容

支持向量机（Support Vector Machine, SVM）是一种强大的机器学习算法，主要用于数据分类问题。其原理是在特征空间中找到一个超平面，使得不同类别的样本点能够被分开，并且使得离超平面最近的样本点到超平面的距离最大化。以下是对线性可分支持向量机原理的详细解释：

定义与分类：
- 支持向量机是一种二类分类模型，它是定义在特征空间上的间隔最大的线性分类器。
- 当训练数据集线性可分时，通过硬间隔最大化，学习一个线性的分类器，即线性可分支持向量机。
超平面的确定：
- 假设给定线性可分数据集T={(x1,y1),(x2,y2),...,(xN,yN)}，其中xi∈Rn，yi∈{+1, -1}。
- 线性可分支持向量机的目标是找到一个超平面（在二维空间中为一条直线，高维空间中为超平面），使得所有正类样本点位于超平面的一侧，负类样本点位于超平面的另一侧。
- 超平面的方程可以表示为：w·x + b = 0，其中w是法向量，b是截距。
间隔最大化：
- 支持向量机算法通过最大化间隔来确保分类的准确性和鲁棒性。间隔是指离超平面最近的样本点到超平面的距离。
- 在硬间隔分类中，所有样本点都必须位于间隔之外，即严格地规定所有的样本点都不在“缓冲区”内。
- 最大化间隔的问题可以转化为求解一个凸二次规划问题。
支持向量：
- 支持向量是离超平面最近的样本点，它们决定了超平面的位置。
- 在线性可分的情况下，支持向量是唯一的，并且只有支持向量对分类决策有贡献。
线性可分支持向量机的模型：
- 线性可分支持向量机的模型由分离超平面和分类决策函数组成。
- 分离超平面方程为：w·x + b = 0
- 分类决策函数为：f(x) = sign(w·x + b)
- 其中，sign是符号函数，当w·x + b > 0时，f(x) = +1；当w·x + b < 0时，f(x) = -1。
函数间隔与几何间隔：
- 函数间隔表示样本点(xi, yi)到超平面的距离在方向上的投影，其计算公式为：γi = yi(w·xi + b)。
- 几何间隔表示样本点(xi, yi)到超平面的实际距离，是函数间隔的规范化形式。
求解算法：
- 支持向量机的求解算法通常使用序列最小优化（SMO）算法等。
- SMO算法通过迭代方式不断选择两个变量进行优化，直到满足停止条件为止。

总结来说，线性可分支持向量机通过最大化间隔在特征空间中找到一个超平面来划分不同类别的样本点，并利用支持向量来确定超平面的位置。其优点在于分类准确、鲁棒性强，并且对于高维数据也具有良好的处理能力。