一.简述数据挖掘的任务、过程、方法和对象。
答:1.数据挖掘的任务:从数据库中挖掘知识,从数据集中抽取和精化一般规律或模式。
2.数据挖掘的过程:(1)确定挖掘的任务或目的是什么。如数据总结、分类、聚集、关联规则或序列模式等。
(2)使用什么样的挖掘算法。同样的任务可以用不同的算法来实现。
3.数据挖掘的方法:选择实现算法有两个考虑因素:
(1)不同数据的特点,因此需要用与之相关的算法来挖掘;
(2)用户或实际系统的要求,有的用户可能希望获取描述型的、容易理解的知识,而有的用户系统的目的是获取预测准确度尽可能高的预测型知识。
4.数据挖掘的对象:经过数据选取、数据预处理和数据变换过的数据,即数据库、数据仓库、Web信息。
(1)数据选取就是根据用户的需要从原始数据库中抽取的一组数据
(2)数据预处理一般可能包括消除噪声、推导计算缺勤数据、消除重复记录、完成数据类型转换等。
(3)数据变换是从初始特征以减少数据开采时要考虑的特征或变量个数。