SVM

最新推荐文章于 2023-03-09 00:30:00 发布

塔楼

最新推荐文章于 2023-03-09 00:30:00 发布

阅读量95

点赞数

分类专栏：算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28915885/article/details/82598297

版权

机器学习同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

##svm##
svm和逻辑回归一样，也是用来学习得到一个决策边界(decision bundary)的，只不过在某些情况下比逻辑回归更加有效。
###1.引子-逻辑回归###
$h_{\theta}(x) = \frac{1}{1+\exp(-\theta^TX)}$
对于该假设：

if y = 1,then $h_{\theta}(x) = 1$ , $\theta^T$ x>>0
if y = 0,then $h_{\theta}(x)=0$ , $\theta^T$ x<<0
cost function is:
$-ylog{\frac{1}{1+exp(-z)}}-(1-y)log(1-\frac{1}{1+exp(-z)})$
对cost进行优化：
$min_{\theta} \frac{1}{m}[\sum_{i=1}^{m} y^{(i)}(-\log h_\theta (x^{(i)})+(1-y^{(i)})(-\log (1-h_\theta (x^{(i)}))))] + \frac{\lambda}{2m}\sum_{j=1}^n \theta_j^2$
###2. svm###
在svm中，去除 $\frac{1}{m}$ 这一项（仅是为了计算方便），设：
$cost_1(\theta^Tx^{(i)})$ = $y^{(i)}(-\log h_{\theta}(x^{(i)}))$
$cost_0(\theta^Tx^{(i)})$ = $(1-y^{(i)})(-\log (1-h_{\theta}(x^{(i)})))$
则优化目标变为：
$min_{\theta} \sum_{i=1}^{m} [y^{(i)}cost_1(\theta^Tx^{(i)})+(1-y^{(i)})cost_0(\theta^Tx^{(i)})] + \frac{\lambda}{2}\sum_{j=1}^n \theta_j^2$
在逻辑回归中， $A+\lambda B$ : $\lambda$ 越大，则赋予B更大的权重，相对B对该式影响越小，所以增大 $\lambda$ 有利于调整B对公式的计算结果的影响.
在svm中， $C A + B$ ;C越小，则赋予B更大的权重，效果与逻辑回归中一样。所以，可以将C设为 $\frac{1}{\lambda}$ 。则，优化目标可以修改为：
$min_{\theta} C\sum_{i=1}^{m} [y^{(i)}cost_1(\theta^Tx^{(i)})+(1-y^{(i)})cost_0(\theta^Tx^{(i)})] + \frac{1}{2}\sum_{j=1}^n \theta_j^2$
该公式则为svm的优化目标。
令 $z=\theta^Tx^{(i)}$
如果y=1,希望： $cost_1(z)$ 是当z>=1时， $cost_1(z)=0$
如果y=0,希望: $cost_0(z)$ 是当z<=-1时， $cost_0(z)=0$
如果C很大，则希望找到使得 $y^{(i)}cost_1(\theta^Tx^{(i)})+(1-y^{(i)})cost_0(\theta^Tx^{(i)})$ 整体为零的最优解。即:
$y^{(i)} = 1:\theta^Tx^{(i)}>=1$
$y^{(i)} = 0:\theta ^Tx^{(i)}<=-1$
则：
$min_{\theta} C*0 + \frac{1}{2}\sum_{j=1}^{n}\theta_j^2$
$s.t. z>=1, 如果y^{(i)}=1;z<=-1,如果y^{(i)}=0$
###3.决策边界###

参考：南京大学吴老师《模式识别》课程和上海财大的《最优化理论与方法》

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

塔楼 CSDN认证博客专家 CSDN认证企业博客

码龄9年

46: 原创

8万+: 周排名

165万+: 总排名

5万+: 访问

: 等级

883: 积分

16: 粉丝

44: 获赞

4: 评论

85: 收藏

私信

关注

热门文章

分类专栏

计算机视觉/目标跟踪/目标检测 12篇
cuda编程 1篇
优化算法 1篇
C/C++ 19篇
java 1篇
python 3篇
机器学习 12篇
linux
算法 9篇
其他 4篇
caffe 5篇
Blob 1篇

最新评论

MIxformerV2的onnx和tensorrt加速
塔楼: 可以对pth模型进行拆解，重新写一个整体的模型的类来进行转化。参考Stark去实现https://github.com/researchmm/Stark/blob/main/lib/tutorials/STARK_Lightning_Ch.md
MIxformerV2的onnx和tensorrt加速
leadir1234: 博主你好，可以发下pytorch转onnx的代码吗
大端到小端的转换
nnnC123456780: 真不错。解释说明非常清晰，而且代码很简短！
对率回归的实验
yhhhw: 博主后面加一列1是为了什么啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。