1、 什么是数据挖掘?什么是知识发现?简述KDD的主要过程
- 数据挖掘是从大量数据中通过算法搜索隐藏于其中的信息的过程
- 知识发现:指的是从大量的数据中提取有效的、新颖的、潜在的有用的,最终可悲理解的模式的非平凡的过程。
- KDD过程:数据整理,数据挖掘,结果的解释评估
将从各个设备上收集到的数据根据要解决的问题进行整理,剔除无用数据,得到达到需要的目标数据,然后对目标数据进行预处理,处理掉空值以及一些不准确的数据。处理过后的数据再用于数据挖掘,之后再进行解释评价。
2、 简述数据挖掘涉及的数据类型以及这些数据的聚合形式
- 数据类型:非数值数据,离散数值数据和连续数值数据;结构化数据和非结构化数据,超文本数据,多媒体数据,空间数据
2. 数据的聚合形式:构造数据立方体
3、 简述数据挖掘的相关领域以及主要的数据挖掘方法
- 相关领域:数据库,统计学,基于规则的系统,可视化技术,高性能计算,模糊集,知识表示,机器学习,粗糙集,模式识别,人工神经网络。
- 数据挖掘方法:
统计方法:
回归分析:多元回归,自回归
判别分析:贝叶斯判别,费歇尔判别,非参数判别
聚类分析:主成分分析,相关分析
机器学习方法:
归纳学习方法:决策树,规则归纳
基于范例学习
遗传算法
神经网络方法
前向神经网络:BP算法等。
自组织神经网络:自组织特征映射、竞争学习等。
数据库方法
多维数据分析
OLAP技术
此外还有面向属性的归纳方法等
4、 如果面对学校数据库,你认为数据挖掘的目标是什么?
答:面对学校的数据库,可以挖掘出学生的学习情况,学习能力,以及老师的科研能力。例如:
- 通过对学生的四六级成绩的挖掘,可以判断出哪个系科英语水平更高
- 通过对各科老师发表的论文的挖掘,可以挖掘出老师的科研能力