【机器学习】Kernel Logestic Regression 和Kernel SVM

最新推荐文章于 2022-06-03 11:41:59 发布

哈乐笑

最新推荐文章于 2022-06-03 11:41:59 发布

阅读量2.1k

点赞数 1

分类专栏：机器学习文章标签：机器学习 kernel lr svm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haolexiao/article/details/70800960

版权

之前一篇文章【机器学习】Linear SVM 和 LR 的联系和区别讲了线性SVM和常规LR的关系和优缺点。结果今天想研究一下Kernel logistic regression（以下简称KLR），结果发现相关的中文资料几乎没有啊，所以特来总结一下

一个模型要能用核函数形式必须满足如下两点：
$w$ 是 $x_i$ 的线性组合是使用Kernel的关键所在。
比如SVM，其最佳 $w$ 来源于 $x_i$ 的线性组合

w * = \sum i = 1 n (α i y i) x i

$w^* = \sum_{i=1}^n(\alpha_i y_i)x_i$
同时这个模型本身是线性模型也是使用Kernel的必要条件
即

y = f (w T x)

$y = f(w^Tx)$

只有满足了以上两点：其判别式才能写成

y = f (\sum i = 1 n α i x T i x) = f (\sum i = 1 n α i < x i, x >)

$y = f(\sum_{i=1}^n\alpha_i x_i^Tx) = f(\sum_{i=1}^n\alpha_i <x_i,x>)$ 进而写成核函数形式：

y = f (\sum i = 1 n α i K (x i, x))

$y = f(\sum_{i=1}^n\alpha_i K(x_i,x))$

LR本身就是一个线性判别模型，所以满足了条件2，那么它是否满足条件1呢？
证明如下：

任何L2正则化的线性模型都可以用核函数

标题就是结论，下面开始证明：

只要需要优化的目标函数如下：

$min L o s s (w) = min w \sum i = 1 n e r r o r (y i, w T x i) + λ w T w$ $\min Loss(w) = \min _w \sum_{i=1}^nerror(y_i,w^Tx_i)+\lambda w^Tw$
即优化的目标是一个广义线性损失函数（这里指 $w$ 需要和 $x_i$ 简单做内积），同时带有一个 $w^Tw$ 的L2正则。
那么：最优的 $w^*$ 就能表示为 $x_i$ 的线性组合

证明如下：
假设最优解 $w^*$ 存在，那么把 $w^*$ 分成两个部分，一个平行于 $x_i$ 的线性组合 $\sum_{i=1}^n\alpha_ix_i$ 部分 $w_{||}$ ，另一个是垂直于其线性组合的部分 $w_\perp$ 。即：
$w^* = w_{||}+w_\perp$
带入到上面的 $Loss(w)$ 目标函数中得到：
对于error部分：

e r r o r (y i, (w | | + w ⊥) T x i)

$error(y_i,( w_{||}+w_\perp)^Tx_i)$
因为

w⊥ $w_\perp$ 部分也垂直于所有的

xi $x_i$ 所以，error部分就等同于：

e r r o r (y i, w

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
【机器学习】Kernel Logestic Regression 和Kernel SVM

之前一篇文章【机器学习】Linear SVM 和 LR 的联系和区别讲了线性SVM和常规LR的关系和优缺点。结果今天想研究一下Kernel logistic regression（以下简称KLR），结果发现相关的中文资料几乎没有啊， SVMww是xix_i的线性组合是使用Kernel的关键所在。比如SVM，其最佳ww来源于xix_i的线性组合 w∗=∑i=1n(αiyi)xiw^* = \s
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。