SVM,感觉很高大上的一个名词,最开始听到的时候还以为是Space Vector Model呢,碰巧那几天看点信息检索的东西;原来是Support Vector Machines。从逻辑回归来推导得出SVM的代价方程为:
其中cost0,cost1如下。可以看出,当满足条件(y = 1 && theta' * x >>0 或者y = 0 && theta' * x << 0)时,SVM的代价方程取值最小 - 只有后面theta那一项。这里C是1/lambda。
SVM是最大间隙分类器,也就是它的决策边界到不同分类的元素距离尽可能大。数学推导就不管了:)
我们用近似性来做特征 - 选定一些基准,计算输入元素与这些基准的近似性。近似性有很多种算法(核),比较常用的是高斯核,如下。当两个元素完全一样的时候,特征值为1&#