第四周支持向量机算法

一、线性分类支持向量机

1、参考标准:

①错分样本数目最少→错分训练样本最少
缺陷:对判别函数的好坏评估不精细(同一数量可能有好多判别函数)、满足的判别函数未必就好(易受异常点影响)

→②支持向量机的标准:margin最大,两类样本到分类面的最短距离之和最大

分类面: f ( x ) = < w ~ , x i > + b ~ { > 0 , if  y i  is 1 < 0 , if  y i  is -1 f(x)=<\tilde{w},x_{i}>+\tilde{b}\begin{cases}>0, & \text{if $y_{i}$ is 1} \\<0, & \text{if $y_{i}$ is -1} \end{cases} f(x)=<w~,xi>+b~{>0,<0,if yi is 1if yi is -1

概念:样例 ( x i , y i ) (x_{i},y_{i}) (xi,yi) 对应于超平面(w,b)的(函数的)间隔是量:
γ i = y i ( < w ~ , x i > + b ~ ) { > 0 , ( x i , y i )  正确分类 < 0 ,   ( x i , y i )  未正确分类 \gamma_{i}=y_{i}(<\tilde{w},x_{i}>+\tilde{b})\begin{cases}>0, & \text{$(x_{i},y_{i})$ 正确分类} \\<0, & \text{ $(x_{i},y_{i})$ 未正确分类} \end{cases} γi=yi(<w~,xi>+b~){>0,<0,(xi,yi) 正确分类 (xi,yi) 未正确分类
当权重向量为单位向量时,几何间隔等价于函数间隔,故:

对于有限个数样本,存在 ε , s . t . y i ( < w ~ , x i > + b ~ ) ≥ ε \varepsilon ,s.t. \quad y_{i}(<\tilde{w},x_{i}>+\tilde{b})≥\varepsilon ε,s.t.yi(<w~,xi>+b~)ε
y i ( < w , x i > + b ) ≥ 1 , ∀ i y_{i}(<w,x_{i}>+b)≥1,\forall i\quad yi(<w,xi>+b)1,i 其中 w = w ~ / ε , b = b ~ / ε , w , b 不 是 单 位 向 量 ! w=\tilde{w}/\varepsilon,b=\tilde{b}/\varepsilon, \\w,b不是单位向量! w=w~/ε,b=b~/ε,w,b

若将分类面(w,b)对应的margin记为 ρ ( w , b ) , 则 ρ ( w , b ) = 2 ∣ ∣ w ∣ ∣ \rho(w,b),则\rho(w,b)=\frac{2}{||w||} ρ(w,b),ρ(w,b)=w2

→给定训练样本集 { ( x 1 , y 1 ) , . . . , ( x l , y l ) , y i ∈ (x_{1},y_{1}),...,(x_{l},y_{l}),y_{i} \in {} (x1,y1),...,(xl,yl),yi{+1,-1}},利用线性SVM求解线性分类面本质上是求解如下优化问题:
优化目标: m i n Φ ( w , b ) = 1 2 < w , w > min\Phi(w,b)=\frac{1}{2}<w,w> minΦ(w,b)=21<w,w>
约束条件: y i ( < w , x i > + b ) ≥ 1 , i = 1 , 2 , . . . , l y_{i}(<w,x_{i}>+b)≥1,i=1,2,...,l yi(<w,xi>+b)1i=1,2,...,l

二、非线性分类支持向量机
三、再生核希尔伯特空间
四、其他相关内容

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值