代损+NP-hard

最新推荐文章于 2023-01-30 10:17:50 发布

universe_1207

最新推荐文章于 2023-01-30 10:17:50 发布

阅读量230

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/universe_1207/article/details/106817078

版权

机器学习专栏收录该内容

11 篇文章 1 订阅

订阅专栏

文章目录

代理损失函数
- NP-hard问题

代理损失函数

当原本的损失函数不方便计算时，就要用到代理损失函数了
二分类问题中，常用的损失函数是0-1损失
- 数据集： $D:\{(X_1,y_1),...,(X_n,y_n)\}$
- 0-1损失: $\hat y)=\sum_{i=1}^m\chi(y_i\neq\hat y_i).$
构造损失函数是为了找到一个最优分类器，使分类器在测试样本上的期望损失最小 $\min_{h}\mathbb{E}_{X\times y}[l(y, h(X))].$ 理论上，可对上式进行优化，得到最优分类器 $h$ ，但这个过程很难，甚至不可进行
- 原因①：概率分布未知，求不出期望
- ②：期望值难以优化，因为0-1损失函数非连续，这个优化问题本质是 $N P - h$ 问题，什么梯度下降统统失效
因此，可考虑一个与零一损失相接近的函数，作为零一损失的替身。这个替身就称作surrogate loss function代理损失函数。
- 为了计算简便，通常选用凸函数，例如逻辑斯蒂的损失函数，就是光滑可导的
- 如果最优化代理损失函数的同时我们也最优化了原本的损失函数，我们就称校对性(calibration)或者一致性(consistency)
- 一个重要的定理，若代理损失函数为凸，并在0点可导，其导数小于0，那么它一定是具有一致性的。这也是为什么我们通常选择凸函数作为我们的loss function的原因之一。

NP-hard问题

P：能以多项式时间被求解的问题称为P-问题，如 $O(n^3)$ 等
NP：①NP-问题不能以多项式的时间求解；②假设找到了一个答案，则这个答案可以以多项式的时间检验该答案是否正确。
- 如：如果要找到(1,2,…,n)的置换且满足第一个元素小于第二个元素，我们则需要至少 $O (n!)$ 的时间来求解，这是大于多项式时间的
- 如果给出任意一个备选答案，比如(5,2,1,4,3)，只需要花多项式的时间（这里是O(n)时间）来检查这个备选答案是不是真的是一个置换并且第一个元素小于第二个元素。
NP-hard：如果一个问题通过一些步骤能够化简为一个NP问题，那么这个问题就是NP-hard问题。换句话说，至少是NP的问题称之为NP-hard问题。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
代损+NP-hard

文章目录代理损失函数NP-hard问题代理损失函数当原本的损失函数不方便计算时，就要用到代理损失函数了二分类问题中，常用的损失函数是0-1损失数据集：D:{(X1,y1),...,(Xn,yn)}D:\{(X_1,y_1),...,(X_n,y_n)\}D:{(X1,y1),...,(Xn,yn)}0-1损失:l(y,y^)=∑i=1mχ(yi≠y^i).l(y, \hat y)=\sum_{i=1}^m\chi(y_i\neq\hat y_i).l(y,y^)=i=1∑mχ(yi
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

universe_1207 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。