数据挖掘笔记
冀州黑马
这个作者很懒,什么都没留下…
展开
-
数据预处理(2)
3、描述性数据汇总 描述性数据汇总技术可以用来识别数据的典型性质,突显哪些数据应当视为噪声或离群点。 对数据预处理的任务,可以从数据的中心趋势和离中趋势上来理解数据的分布。为了对大数据进行有效计算,可以使用不同的度量方法。 中心趋势:均值(mean)、中位数(median)、众数(mode)、中列数(midrange) 离中趋势:四分位数(quartiles)、四分位数极差(inter原创 2012-08-14 19:33:50 · 512 阅读 · 0 评论 -
1、数据预处理(1)
1、解决的问题 数据库中的数据极易受到噪声、丢失、不一致等数据的侵扰,数据也可能来自多个异构的数据源。为了提高数据挖掘质量,需要对噪声进行清理,丢失的数据进行补充,异构的不一致的数据转换成一致的数据。换句话说,就是把杂七杂八的数据整理成我们需要的条理清晰的数据。 为了解决现实生活中数据的不完整性、含噪声、不一致性的问题,需要对数据进行预处理。 2、可用的技术 预处理的技术可以分原创 2012-08-09 15:33:25 · 500 阅读 · 0 评论