SVM 的英文叫 Support Vector Machine,中文名为支持向量机。它是常见的一种分类方法,在机器学习中,SVM 是有监督的学习模型。
什么是有监督的学习模型呢?它指的是我们需要事先对数据打上分类标签,这样机器就知道这个数据属于哪个分类。同样无监督学习,就是数据没有被打上分类标签,这可能是因为我们不具备先验的知识,或者打标签的成本很高。所以我们需要机器代我们部分完成这个工作,比如将数据进行聚类,方便后续人工对每个类进行分析。
SVM 作为有监督的学习模型,通常可以帮我们模式识别、分类以及回归分析。
先看一张图,明白超平面的概念:
二维平面内,用曲线将颜色球分开了;进一步,三维立体层面?
在这里,二维平面变成了三维空间。原来的曲线变成了一个平面。这个平面,就叫做超平面。
SVM 的工作原理
用 SVM 计算的过程就是帮我们找到那个超平面的过程,这个超平面就是我们的 SVM 分类器。
上图中,直线 A、直线 B 和直线 C,究竟哪种才是更好的划分呢?
B直线更好,因为B与蓝色球靠的很近;A直线更好,因为A与红色球更近;但,实际生活中,蓝色球可能会朝着红色区域移动,红色球会向着蓝色区域移动;所以,最终A直线更好,因为它的鲁棒性更好。
鲁棒性/抗变换性(英文:robustness)原是