转自http://blog.csdn.net/u013300875/article/details/44081067
很多机器学习分类算法,比如支持向量机(SVM),的介绍都说了假设数据要是线性可分。如果数据不是线性可分的,我们就必须要采用一些特殊的方法,比如SVM的核技巧把数据转换到更高的维度上,在那个高维空间数据更可能是线性可分的(Cover定理)。
理论上一定能在更高的维度把数据线性可分。
何为线性可分和线性不可分
线性可分就是说可以用一个线性函数把两类样本分开,比如二维空间中的直线、三维空间中的平面以及高维空间中的线型函数。
所谓可分指可以没有误差地分开;线性不可分指有部分样本用线性分类面划分时会产生分类误差的情况。
在这种情况下,SVM就通过一个非线性映射函数把样本映射到一个线性可分高维空间,在此高维空间建立线性分类面,而此高维空间的现行分类面对应的就是输入空间中的非线性分类面。
判断是否线性可分
不同样本集用凸包包起来,判断不同凸包的边是否有交叉。