以下内容转自:
有序回归(ordinal regression)_音程的博客-CSDN博客_ordinal regression
假如有如下训练数据:
(x1,明天),(x2,后天),(x3,大后天)。
其中第一项x表示一个事件,第二项表示该事件发生的时间。
现在需要你训练一个模型,能够给定事件x作为输入,输出其发生的时间。
乍一看是一个分类(classification)问题。
但是如果采用普通的分类方法,由于以上标签会被one-hot编码成:
(x1,(1,0,0)),(x2,(0,1,0)),(x3,(0,0,1))。
所以分类的时候,当预测错了类别的时候,损失是一样的。因为one-hot编码中类别之间距离是一样的。
即给定x,如果模型预测的结果是明天。我们会发现真实标签是后天或者大后天都是一样的损失。这不合理,因为我们观察到这些标签有顺序关系,预测结果是明天时,真实标签是大后天应该比后天带来更大的损失才对,因为更加遥远,更加错误。
解决办法:有序回归。
为了突显有序可以将以上数据编码成
(x1,0),(x2,1),(x3,2)。
————————————————
版权声明:本文为CSDN博主「音程」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_43391414/article/details/113034297