- 博客(2)
- 收藏
- 关注
原创 《数据挖掘——概念和技术》笔记之数据预处理
数据预处理对于数据仓库和数据挖掘都是一个重要的问题,因为现实中的数据多半是不完整的、有噪声的和不一致的。数据预处理包括数据清理、数据集成、数据变换和数据规约。 描述性数据汇总为数据预处理提供分析基础。数据汇总的基本统计学度量包括度量数据集中趋势的均值、加权平均、中位数和众数,度量数据离散程度的极差、四分位数、四分位数间距、方差和标准差。图形表示,如直方图、盒图、分位数图、分位数-分位数图、
2007-07-03 22:52:00 2694
原创 《数据挖掘——概念和技术》笔记之概论
数据库技术已经从原始的文件处理发展到开发具有查询和事务处理的数据库管理系统。进一步的发展已经导致越来越需要有效的高级数据分析工具。这种需求是各种应用收集的数据爆炸性增长的必然结果,这些应用包括商务和管理、行政管理、科学和工程以及环境控制。 数据挖掘是从大量数据中发现有趣模式,其中数据可以存放在数据库、数据仓库或其他信息库中。这是一个年轻的跨学科领域,源于诸如数据库系统、数据仓库、统计学、机
2007-07-03 22:46:00 1793 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人