背景
目标
案例流程
方案一:下采样
方案二:采用SMOTE 技术来处理数据不平衡问题,SMOTE (Synthetic Minority Over-sampling Technique),即:合成少数样本过采样技术
(1) 从少数类样本中,随机选择一个样本A;
(2) 确定k值(通常是k=5),找到该样本A最近的k个样本;
(3) 从该k个近邻样本中随机选择一个样本B;
(4) 生成的新样本为:样本A与样本B中间的一个随机点。
背景
目标
案例流程
方案一:下采样
方案二:采用SMOTE 技术来处理数据不平衡问题,SMOTE (Synthetic Minority Over-sampling Technique),即:合成少数样本过采样技术
(1) 从少数类样本中,随机选择一个样本A;
(2) 确定k值(通常是k=5),找到该样本A最近的k个样本;
(3) 从该k个近邻样本中随机选择一个样本B;
(4) 生成的新样本为:样本A与样本B中间的一个随机点。