文章目录 算法原理算法存在的问题 算法原理 人工合成少数类样本它以每个样本点的k个最近邻样本点为依据,随机的选择N个邻近点进行差值乘上一个[0,1]范围的阈值,从而达到合成数据的目的核心:特征空间上邻近的点其特征都是相似的。它并不是在数据空间上进行采样,而是在特征空间中进行采样三个参数:样本集数据量,采样比例(是原来样本集的几倍),采样的最近邻数对样本集中的观测点,确定 算法存在的问题