为了解决不平衡的数据分类问题,作者设计了动态的课程学习。总的来说设计了两个课程。
- 1)、采样程序从不平衡到平衡以及从简单到复杂。
- 2)、分类loss和度量学习loss的权重调整,开始阶段关注度量学习,后面关注分类。
采样:
初始状态:如三分类开始为1:100:50:20.不平衡,
最终状态为平衡状态1:1:1:1,每一个轮次会对每一个类别做指数运算。
每一个轮次的每一个batch都根据设置的程序:有一个target分布比例以及未重采样之前的分布current。
- 如果target小于current,那么说明该类别数据多,就需要欠采样target/current比例的j类样本,权重设置为1,其他类别为0。
- 如果target大于current,那么说明该类别数据少,则对该类别的loss进行加权。不过采样吗?