machine learning
文章平均质量分 50
zygzdf
这个作者很懒,什么都没留下…
展开
-
样本不均衡问题
医疗数据经常highly biased (比如很少一部分人得心脏病,大部分人不得心脏病) 。即样本在不同类别上的不均衡分布问题( class distribution imbalance problem) 采用什么策略处理数据不均衡问题?当数据不均衡时,采用什么指标来衡量模型的优劣? [b]1. 当数据样本过少时[/b],Leave One Out Cross Validation...原创 2015-04-13 11:18:54 · 320 阅读 · 0 评论 -
weka up-sampling & down-sampling
[b]up-sampling:[/b] SMOTE algorithm,over-sampled by creating ``synthetic'' examples rather than by over-sampling with replacement. [b]Weka supervised SMOTE filter [/b] 两个参数: [list] [*]neares...原创 2015-06-24 20:14:22 · 557 阅读 · 0 评论