图片引用文章:complexity measures of supervised classification problems
文章中的N1表示两类样本在分界面附近的近似比例。
所用方法是 :
1. 建立包含所有样本的最小生成树MST(不考虑类标);
2. 依据类标找出被一条线连接的不同类标的所有点;
3. 在根据这些点的比例近似估计分界面附近的样本比例。
该方法启示:可以用于在处理非平衡问题时,依据求得的分界面附近的样本比例进行上下采样。
实验效果待验证。
图片引用文章:complexity measures of supervised classification problems
文章中的N1表示两类样本在分界面附近的近似比例。
所用方法是 :
1. 建立包含所有样本的最小生成树MST(不考虑类标);
2. 依据类标找出被一条线连接的不同类标的所有点;
3. 在根据这些点的比例近似估计分界面附近的样本比例。
该方法启示:可以用于在处理非平衡问题时,依据求得的分界面附近的样本比例进行上下采样。
实验效果待验证。