目录
4. 梯度调和机制GHM Gradient Harmonizing Mechanism
1. 数据类别不均衡问题
常见的分类任务大部分数据的标签都是某几类,而很少的类别的数据有时也很重要,因而需要模型去预测。
2. 解决办法
过采样:
对于某些类别数据比较少,对它们进行重复采样,以达到相对平衡,重复采样的时候,有时也会对数据加上一点噪声;
缺点:过采样可能导致这些类别产生过拟合的现象
欠采样:
对于某些类别数据特别多,只使用部分数据,抛弃一些数据;
缺点:欠采样则容易导致模型的