- 博客(1)
- 收藏
- 关注
原创 样本分布不平衡,机器学习预测模型如何调整
样本不平衡时,假如阳性样本组的样品数目约为阴性样本组的3倍。不通过建模而只是随机选择即可获得75%的正确率。而阴性样本组的预测准确率却很低。 通常,在生物和医学中,我们关注的是占少数的样本,如是否患病,我们希望能尽量发现可能存在的疾病,提前采取措施。 因此如何处理非平衡样品是每一个算法应用于分类问题时都需要考虑的。不平衡样本的模型构建中的影响主要体现在2个地方: 1、随机采样构建决策树时会有较大概率只拿到了样品多的分类,这些树将没有能力预测样品少的分类,从而构成无意义的决策树。 2、在决策树的每个分子节点所
2021-05-31 11:14:33
1173
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人