多分类loss函数本质理解

最新推荐文章于 2024-08-14 17:11:04 发布

Takoony

最新推荐文章于 2024-08-14 17:11:04 发布

阅读量1.7w

点赞数 2

分类专栏： ml

本文链接：https://blog.csdn.net/ningyanggege/article/details/82350710

版权

ml 专栏收录该内容

188 篇文章 17 订阅

订阅专栏

一、面对一个多分类问题，如何设计合理的损失函数呢？

1、损失函数的本质在数学上称为目标函数；这个目标函数的目标值符合最完美的需求；损失函数的目标值肯定是0，完美分类的损失必然为0 ；

2、损失函数分为两部分，一部分为正确的分类，一部分为错误的分类；保留其中任何一个部分都可以达到目标；就好比两条路都可以通向罗马；都可以通过转化均可以令损失函数的最小值为0时，为目标值；（当然最小值不一定要为0 ）；最关键是最小化方向是通向目标值的；

3、多分类问题涉及概率问题，目标函数中设计只保留正确的部分（为什么不保留错误部分，我想都可以达到目的，这里保留正确部分，计算更方便）；用极值思维想象完美分类情况下，输出的正确类别的概率必然是1，所以损失函数loss=-1/n(Px1+Px2+Px3+……)；Px1代表样本x为x1的情况下，输出样本类别相同的概率；最好的情况就是p值都为1；损失值为0 ，可loss函数为-1；如何设计才能等效呢？答案就是加log函数；Loss=-1/n(logPx1+logPx2+logPx3+……)；目标函数最小值就是0；

二、如何在损失函数中只保留正确的部分呢？
1、从逆向的角度而言，错误部分的前面加个系数0，正确部分为1；从简单开始做起，比如说01分类，y*（logPy=1）+(1-y)*（logPy=0）; y为样本真实分类；这个就能保存了；y=1时，就保留了第一部分，y=0时就保留了第二部分；但当将01分类扩展成三分类甚至多分类时，这种情况就不能够适应了；这是因为没有明白本质问题；

2、可以将真实样本标签输出转化成概率值；只是正确的概率值为1，其他类别概率为0；这样就可以完美解决多分类的问题；就是说每一个模型输出类别Log概率前乘以一个概率值； $Loss=-1/n(P^{_{y=1}}*log(\tilde{P_{y=1}})+P^{_{y=2}}*log(\tilde{P_{y=2}})+P^{_{y=3}}*log(\tilde{P_{y=3}})+\cdots)$ ；这个公式里面的P值全为1；为0的忽略掉了；