数据预处理 注释: 1.离群点与异常点是有区别的。离群点仅仅是指该点的值偏离正常值;而异常点是指该点是存在异常的。 2.依靠相对距离判断一个点是否为离群点。 3.对于标准型数据,不同的编码方式将会影响问题的复杂度。 4.对于不平衡数据,不能只关注准确率。可以采用G-mean或F-measure来对结果进行评估。