统计学习中遇到的一些问题

最新推荐文章于 2024-08-10 10:46:00 发布

Mr_tianyanxiaobai

最新推荐文章于 2024-08-10 10:46:00 发布

阅读量396

点赞数 1

分类专栏：统计学习方法文章标签： python 机器学习

本文链接：https://blog.csdn.net/Mr_tianyanxiaobai/article/details/109065169

版权

统计学习方法专栏收录该内容

4 篇文章 0 订阅

订阅专栏

感知机的损失明明是几何距离，为什么可以省略 $\frac{1}{||w||_2}$ ，将函数距离当做最后的损失函数？
答：因为感知机的使用前提就是认为原数据线性可分，也就是说到最后函数的损失会降到 0 。如果说函数损失为 0，那么是否乘以 $\frac{1}{||w||_2}$ 的意义就不大了（因为 $\frac{1}{||w||_2}$ 不可能为0，只有函数间隔部分可能为0）。换句话说，是否加上 $\frac{1}{||w||_2}$ ，都不会影响最终的损失结果，故为了方便计算，将其省略。
能够简单阐述一下几何间隔的推导过程吗？

如上图， $d||_2*y_i$ 就是最终几何距离，其中 $y_i$ 只是用来保证距离始终为正的。
为什么在求取间隔分离超平面时，说函数间隔 $\hat{\gamma}$ 的取值并不影响最优化问题的求解？
最优化问题的表示形式如下：

其中 $\gamma$ 是几何间隔，转换后的优化函数中的 $\hat{\gamma}$ 是函数间隔。
答：假设当 $\hat{\gamma}=1$ 时， $w=w_i,b=b_i$ 。那么任何其他 $\gamma$ 的取值都可以使用 $\lambda\cdot\hat{\gamma}$ 表示，由于函数间隔的性质，我们可以算出此时的 $w, b$ 分别为 $\lambda w_i$ 、 $\lambda b_i$ 。然后我们将任意数 $\lambda\cdot\hat{\gamma}$ 、 $\lambda w_i$ 、 $\lambda b_i$ 带入上面的目标函数和约束函数中，发现无论 $\lambda$ 等于几，都会被抵消，无法影响上列优化函数的解。综上，我们完全可以直接将 $\hat{\gamma}$ 设置为 1 。得到下面目标函数： $\frac{1}{||w||_2}$ 。
然后由于 $\frac{1}{||w_2||}$ 和 $\frac{1}{2}||w||_2$ 等价。因此，最终的目标函数可以化为下面形式：

在这里插入图片描述

Mr_tianyanxiaobai

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习中遇到的一些问题

感知机的损失明明是几何距离，为什么可以省略 1∣∣w∣∣2\frac{1}{||w||_2}∣∣w∣∣21，将函数距离当做最后的损失函数？答：因为感知机的使用前提就是认为原数据线性可分，也就是说到最后函数的损失会降到 0 。如果说函数损失为 0，那么是否乘以 1∣∣w∣∣2\frac{1}{||w||_2}∣∣w∣∣21 的意义就不大了（因为 1∣∣w∣∣2\frac{1}{||w||_2}∣∣w∣∣21不可能为0，只有函数间隔部分可能为0）。换句话说，是否加上 1∣∣w∣∣2\frac{.
复制链接

扫一扫

专栏目录