最近在编程序的时候碰到了不平衡的数据,在处理这类数据的时候可以有以下三种方法:
第一种:上采样
是指把小众类的样本复制多份。
第二种:下采样
是从多数类样本剔除掉一部分或将大多数的样本选取部分样本
第三种:SMOTE方法
其中smote方法是上采样中最常用到的方法。他的思想是合成新的少数类的样本,合成的策略是对每一个少数类样本a,从他的最近领域中随机选择一个样本b(这个样本还是少类样本中的一个),然后在a和b之间的联想上随机选择一点作为新合成的少数类样本。
最近在编程序的时候碰到了不平衡的数据,在处理这类数据的时候可以有以下三种方法:
第一种:上采样
是指把小众类的样本复制多份。
第二种:下采样
是从多数类样本剔除掉一部分或将大多数的样本选取部分样本
第三种:SMOTE方法
其中smote方法是上采样中最常用到的方法。他的思想是合成新的少数类的样本,合成的策略是对每一个少数类样本a,从他的最近领域中随机选择一个样本b(这个样本还是少类样本中的一个),然后在a和b之间的联想上随机选择一点作为新合成的少数类样本。