- 输入数据->数据预处理->数据挖掘->后处理->信息
- 数据预处理:特征选择,维规约,规范化,选择数据子集。
- 后处理:模式过滤,可视化,模式表示。
- 数据挖掘挑战:可伸缩,高维性,异种数据和复杂数据,数据的所有权与分布,非传统分析(假设检验模式)。
- 数据挖掘=数据库技术+并行计算+分布式计算+统计学+AI+机器学习+模式识别。
- 数据挖掘任务:预测任务和描述任务。
- 预测建模:分类,用于离散目标。回归,用于连续目标。
- 关联分析:数据中强关联特征模式。蕴含规则或特征子集。
- 聚类分析:紧密相关的观测值组群。
- 异常检测:识别特征显著不同于其他数据的观测点。高检测率和低误报率。
【SpamHunter】数据挖掘之基本概念——整理自书籍
最新推荐文章于 2024-09-20 00:09:16 发布