1.类别权重 (误分类代价很高时使用)
class weight:传入一个各类别权重字典,表示模型对各类别的关注程度。如下图,11类就有11个权重参数。是平衡分类的一种简单的方式,通过设置类别权重以平衡数据集中样本分布不均衡的情况。(例如在分类合格品和不合格品时,将不合格品分类为合格品的话,对于检查人员这一错误的代价就很大,因此就可以适当提高不合格品这一类别的权重参数,增加分类的准确性)
计算(参考【调参07】不平衡分类问题中分类权重计算与设置_datamonday的博客-CSDN博客_类别权重)
1)class weight,要求每类样本受到相同的关注,
又因为0-1效果要更好一些,所以权重参数可设置为0.069,0.18
2. 样本权重(样本类别极度不平衡时使用)
sample weight:每个训练样本的权重,在标准的训练过程中,每个样本都被视为等权重的,即它们对损失函数的贡献是相同的。但如果你要训练一个用于识别猫狗的模型,但数据集中猫的图片远少于狗的图片。为了平衡这种类别不平衡,你可以为猫的图片分配更高的权重,使模型在训练过程中更加关注猫的图片,从而提高对猫的识别能力。