数据挖掘概念与分析第八章笔记

分类的基本概念 分类  分类是一种重要的数据分析形式,它提取刻画重要数据类的模型,这种模型称为分类器,预测分类(离散的,无序的)类标号。 分类和数值预测是预测问题的两种主要类型。 分类的一般方法  数据分类涉及两个过程: 1:学习阶段:建立描述预先定义的数据类或概念集的分类器。分类算法...

2018-08-23 11:09:30

阅读数:57

评论数:0

数据挖掘概念与分析第六章笔记

挖掘频繁模式 频繁模式是频繁地出现在数据集中的模式,主要包括频繁项集模式,频繁序列模式,和频繁结构模式。 我们先了解什么是项集,K-项集,数据集,绝对支持值的概念。书中都有讲解,这里简单的来说一下。 项集:最基本的模式就是项集,是指若干个项的集合 K-项集:包含K个项的项集 数据集:典型...

2018-08-20 14:52:24

阅读数:109

评论数:0

数据挖掘概念与分析第五章笔记

数据立方体技术 在第四章的时候我们提出了一种技术OLAP,并且指明数据立方体系统在各种粒度为多维数据的交互分析提供OLAP工具。虽然在第四章已经简要的介绍过数据立方体,但是并没有指明数据立方体是怎样实现的,这个章节我们将对完全立方体和部分立方体的物化技术进行讲解 基本概念 完全立方体:p12...

2018-08-17 15:39:25

阅读数:65

评论数:0

数据挖掘概念与分析第四章笔记

数据仓库与联机分析处理 构造数据仓库涉及数据清理,数据集成和数据变换 。那么什么是数据仓库呢? 数据仓库的定义很多,William H的说法是:数据仓库是一个面向主题的,集成的,时变的,非易失的数据集合,支持管理者的决策过程。数据仓库和数据库有什么不同? 名称 数据特点 技术 ...

2018-08-09 16:18:43

阅读数:84

评论数:0

数据挖掘概念与分析第三章笔记

数据预处理  数据预处理主要包括以下几步: 数据清理:可以用来清除数据中的噪声,纠正不一致 数据集成:将数据由多个数据源合并成一个一致的数据存储,如数据仓库,第四章会单独讲数据仓库 数据规约:可以通过如聚集,删除冗余特征或聚类来降低数据的规模 数据变换:可以用来把数据压缩到较小的空间,如...

2018-08-08 17:36:23

阅读数:169

评论数:0

数据挖掘概念与分析第二章笔记

本章主要是为了认识数据的属性和类型,为后面的数据预处理做知识准备 1:数据属性    ---是一个数据字段,表示数据对象的一个特征。有以下的属性类型 标称属性 标称属性的值是一些符号或事物的名称。每个值代表某种类别,编码或状态,因此标称属性又被看做是分类的。标称属性是定性的 二元属性 二元属...

2018-08-07 16:49:18

阅读数:63

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭