1.数据仓库 一种多个异种数据源在单个站点以统一的模式组织的存储,以支持管理决策。
2.OLAP技术 一种分析技术,具有汇总合并和聚集功能,以及从不同的角度观察信息的能力。 但对于深层次
的分析, 如数据分类 聚类 和数据随时间变化的特征,需要借助其他分析工具。
3. 知识发现过程步骤, 数据清理 数据集成 数据选择 数据变换 数据挖掘 模式评估 知识表示
4.数据挖掘任务 一般分为两类 描述 和 预测
5.聚类分析 与分类和预测 不同 聚类 分析数据对象 而不考虑已知的类标记。对象 根据 最大化类内的相似
性,最小化类间的相似性的原则进行聚类或分组
6 孤立点分析 数据库 可能包含一些数据对象,他们与一般的行为和模型不一致。然而,在一些应用中,罕
见的事件可能更有研究价值。
7.演变分析 描述行为随时间变化的对象的规律或趋势。
8.性能问题 数据挖掘算法的有效性,可伸缩性和并行处理。 许多数据库的大容量,数据的广泛分布和一些
数据算法的计算复杂性 是促使开发并行和分布式数据挖掘算法的因素。
9.多维数据库模式 星型模式 雪花型模式 星型模式 星型模式包括一个大的包含大批数据和不冗余的中心表
一组小的附属表维表。 雪花型模式 相比星型模式更加易于维护,并且节省存储空间,但是执行查询需要更
多的连接操作,所以,可能会降低浏览的性能。
10.多维数据模型上,数据组织成多维,每维包含由概念分层定义的多个抽象层。这种组织为用户从不同角度
2.OLAP技术 一种分析技术,具有汇总合并和聚集功能,以及从不同的角度观察信息的能力。 但对于深层次
的分析, 如数据分类 聚类 和数据随时间变化的特征,需要借助其他分析工具。
3. 知识发现过程步骤, 数据清理 数据集成 数据选择 数据变换 数据挖掘 模式评估 知识表示
4.数据挖掘任务 一般分为两类 描述 和 预测
5.聚类分析 与分类和预测 不同 聚类 分析数据对象 而不考虑已知的类标记。对象 根据 最大化类内的相似
性,最小化类间的相似性的原则进行聚类或分组
6 孤立点分析 数据库 可能包含一些数据对象,他们与一般的行为和模型不一致。然而,在一些应用中,罕
见的事件可能更有研究价值。
7.演变分析 描述行为随时间变化的对象的规律或趋势。
8.性能问题 数据挖掘算法的有效性,可伸缩性和并行处理。 许多数据库的大容量,数据的广泛分布和一些
数据算法的计算复杂性 是促使开发并行和分布式数据挖掘算法的因素。
9.多维数据库模式 星型模式 雪花型模式 星型模式 星型模式包括一个大的包含大批数据和不冗余的中心表
一组小的附属表维表。 雪花型模式 相比星型模式更加易于维护,并且节省存储空间,但是执行查询需要更
多的连接操作,所以,可能会降低浏览的性能。
10.多维数据模型上,数据组织成多维,每维包含由概念分层定义的多个抽象层。这种组织为用户从不同角度