SVM 分类

最新推荐文章于 2024-07-16 10:43:25 发布

xiao___qiao

最新推荐文章于 2024-07-16 10:43:25 发布

阅读量541

点赞数 1

本文链接：https://blog.csdn.net/qq_37074299/article/details/112081672

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1 目的和思想

SVM 模型的目的：二分类和多分类
SVM 的整体思想：用多个面，将其分为多个部分

2 模型原理

模型实现：

通过训练数据，拟合，得到模型的参数值

3 模型推导

二维线性可分离模型是 $w^T+b=0$ ，训练集可以如下线性划分：
$\text{if}\quad y_i=+1，\text{is}\quad w^T+b \geq 0$ $\text{if}\quad y_i=-1，\text{is}\quad w^T+b < 0$
模型是线性可分离的，可以得到基本模型
$y_i(w^T+b) \geq 0$
通过 1) 和 2) ，得到 $∣ ∣ w ∣ ∣$ 越小， $d$ 越大
1） $w^T+b=0$ 和 $aw^T+ab=0$ 是同一个面，如果 $(w, b)$ 满足基本模型，那么 $(a w ， a b)$ 也满足基本模型
2）矢量到平面的距离
$\tfrac{|w^T+b|}{||w||}$
根据 2 和 3 ，推导了SVM的基本模型
$\quad \tfrac{1}{2}||w||^2$ $\quad y_i(w^T+b) \geq 1$
在支持向量机的线性基本形式的基础上，将其改进为非线性解。需在目标函数添加一个正则项并将低维 $x$ 转换为高维 $\varphi(x)$ ，得到
$K(x_i,y_i)=\varphi(x_i)^T\varphi(y_i)$
SVM非线性原函数如下
$\quad \tfrac{1}{2}||w||^2+C\sum_{i=1}^N \xi_i$ $\quad y_i(w^Tx_i+b) \geq 1-\xi_i$ $\xi_i \geq 0$
通过将原始函数转换为对偶函数的原理，将SVM非线性转换为对偶问题
$\quad \theta(\alpha, \beta)=inf\{\tfrac{1}{2}||w||^2-C\sum_{i=1}^N \xi_i+\sum_{i=1}^N \beta_i\xi_i+\sum_{i=1}^N \alpha_i[1+\xi_i-y_iw^T\varphi(x_2)-y_ib]\}$ $s.t.\quad \alpha_i\geq 0 \quad (i=1\sim N)$ $\beta_i\geq 0$
通过对 $\omega,\xi,b$ 分别求导，得到
$\quad \theta(\alpha)=\sum_{i=1}^N \alpha_i- \tfrac{1}{2}\sum_{i=1}^N \sum_{j=1}^N \alpha_i\alpha_j y_i y_jK(x_i,y_i)$ $\quad0\leq \alpha_i \geq C$ $\sum_{i=1}^N \alpha_iy_j =0$
最优化求解，得到
$w^T\varphi(x)=\sum_{i=1}^N \alpha_iy_iK(x_i,x)$
通过KKT条件后，求出 $b$ 的值
$b=\frac{1-y_i\sum_{i=1}^N \alpha_iy_iK(x_i,x)}{y_i}$
模型测试，输入样本，可得到结果
$\sum_{i=1}^N x_iy_iK(x_i,x)+b \geq 0 \quad \Rightarrow \quad y=+1$ $\sum_{i=1}^N x_iy_iK(x_i,x)+b < 0 \quad \Rightarrow \quad y=-1$

4 SVM 总结

SVM 分类时训练数据如果非常大，时间消耗就会很大，同时对多分类问题效果不算太好

5 SVM 函数使用

5.1 输入

特征值+目标值

data = [[5.5, 4.7, 1.3, 0],
        [3.2, 7.2, 1.8, 0],
        [6.9, 11.7, 10.3, 1],
        [5.2, 7.8, 4.5, 0],
        [8.8, 9.9, 10.1, 1],
        [3.4, 7.5, 8.4, 1]]
data=np.array(data)

5.2 函数及参数

from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
import numpy as np

x, y = np.split(data,
                (3,),    # 前 3列作为特征值
                axis=1)  # 1: 以列的方式  0: 以行的方式
                
x_train, x_test, y_train, y_test = train_test_split(x, y,
                                                    random_state=2,  # 用于洗牌，打乱数据
                                                    train_size=0.5)  # 训练样本占比
                                                    
model = SVC(C=0.6,         # 误差上限, 默认 0.5
          kernel='rbf',  # 指定核函数
          gamma=10)      # 核系数
model.fit(x_train, y_train.ravel())  # ravel():将二维转为一维

5.3 输出及应用

print(model.score(x_train, y_train))  # 精确度
y_predict = model.predict(x_test)     # 测试集预测
print(y_predict)
print(model.score(x_test, y_test))

在这里插入图片描述

xiao___qiao

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录