数据挖掘
文章平均质量分 90
X_Jun005
这个作者很懒,什么都没留下…
展开
-
数据预处理(理论总结)
数据预处理数据清洗缺失值处理异常值处理数据集成实体识别冗余属性识别数据变换简单函数变换规范化连续属性离散化属性构造小波变换数据规约属性规约数值规约python主要预处理函数数据清洗就是删除,去除原始数据集中,无关的,重复的,平滑噪声的数据,筛选掉与挖掘无关的数据缺失值处理三种方法:删除,插补,不处理常见插补直接删除的缺点它是以减少历史数据来换取数据的完备,会造成资源的大量浪费,在数据量本身就少的情况下,会造成大量隐藏在数据的信息丢失异常值处理数据集成数据集成就是将分布在不同数据源的原创 2021-05-07 16:57:19 · 1359 阅读 · 0 评论 -
数据探索性分析
文章目录数据探索性分析数据质量分析缺失值分析异常值分析一致性分析数据特征分析分布分析对比分析统计量分析周期性分析贡献度分析相关性分析python主要数据探索函数基本统计特征函数拓展统计特征函数统计作图函数(matplotlib)数据探索性分析数据质量分析缺失值分析1、缺失值产生的原因1)有些暂时无法获取的数据,或者获取代价太大的数据2)有些是被遗漏的数据输入时认为不重要,忘记填写,对数据理解错误,一些人为的因素数据采集设备故障,存储介质故障,传输媒体的故障等非人为丢失2、缺失值原创 2021-05-07 16:59:46 · 454 阅读 · 0 评论