![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习西瓜书
文章平均质量分 63
小雯成长计划
这个作者很懒,什么都没留下…
展开
-
分类问题中类别不平衡问题的解决方法
类别不平衡(class-imbanlance)就是指分类问题中不同类别的训练样本相差悬殊的情况,例如正例有900个,而反例只有100个,这个时候我们就需要进行相应的处理来平衡这个问题。原创 2023-07-07 11:08:04 · 155 阅读 · 0 评论 -
【模型评估与选择】
每次选取k-1个子集的并集作为训练集,余下的子集作为测试集,这样会得到k组训练集和测试集,从而进行K次训练和测试,最终返回k个测试结果的均值。即便给了训练集和测试集的比例,也会存在多种划分方法,模型的评估结果也会有所差别,因此,单次留出法得到的结果不够稳定可靠,一般要采用若干次随机划分重复实验后取平均值作为留出法的评估结果。将预测结果排序,最有可能是正例的排在最前面,以此类推,按此顺序逐个把样本按照正例预测,每次计算查准率与查全率,以查全率为横轴,查准率为纵轴,即可得到查准率-查全率曲线,简称“原创 2023-07-06 16:06:14 · 76 阅读 · 0 评论