数据挖掘
文章平均质量分 74
奔跑的小龟
技术小龟,奔跑在路上
展开
-
数据挖掘概念与技术第三版 范明 孟晓峰译 第四章习题答案
4.1查询驱动的方法需要复杂的信息过滤和集成处理,这种方法是低效的,并且对于频繁的查询,开销可能很大。而更新驱动将来自多个异构源的信息预先集成,并存储在数据仓库中,供直接查询和分析,并且还支持复杂的多维查询,优势明显,因此更获得工业界的青睐。 很明显,当异构数据库数量较少时,查询开销本来就不大,查询驱动的方法就很容易进行查询分析,而构建数据仓库的代价依然很大,再使用更新驱动就得不偿失了原创 2017-10-05 17:11:21 · 10031 阅读 · 0 评论 -
数据挖掘概念与技术第三版 范明 孟晓峰译 第四章 数据仓库与联机分析处理学习笔记
1.数据仓库:一个数据集合,四个特点:面向主题的(指面向具体应用)、集成的(指是多个数据库数据集成在一起)、时变的(数据来自历史多个时间范围)、非易失的(分离存放数据,不需要事务处理,数据不容易丢失)。2.联机事务处理(OLTP)与联机分析处理(OLAP)的最原始区别: OLTP面向顾客,主要用于对单条数据的增删改查操作;OLAP面向市场,主要是对集中的大量数据进行分析处理。3.元数原创 2017-10-04 15:04:06 · 1278 阅读 · 0 评论 -
数据挖掘概念与技术第三版 范明、孟晓峰译 第三章习题答案
3.1 例子:相对于一个80%地址正确的数据库,市场分析人员要使用数据进行目的营销,对数据的准确性总体上还能接受;但对于销售人员来说,要利于数据进行一对一推销,对这样的数据则完全不能接受。 可信性:反映用户信赖的数据规模; 可解释性:反映数据是否容易理解。3.2 处理元祖属性缺失值的方法:1忽略此元祖:适合于多属性缺失;2人工填写缺失值:数据量较小时;3使用一个原创 2017-10-03 08:53:21 · 8166 阅读 · 1 评论