关联分析(Apriori,FP-growth)

关联分析是数据挖掘中的重要组成部分,旨在挖掘数据中的频繁模式。我们可以通过一个案例数据库挖掘著名案例来大致了解挖掘频繁项集并产生关联规则。 关联分析的基本概念 关联分析:在大规模数据集中寻找有趣的关系 频繁项集:经常出现在一起的物品集合,即包含0个或者多个项的集合 关联规则:暗示两个物品之...

2018-09-21 21:14:23

阅读数:8

评论数:0

频繁项集,频繁闭项集,最大频繁项集

转自:https://blog.csdn.net/u013007900/article/details/54743395 Frequent Itemset(频繁项集) 称I={i1,i2,...,im}I={i1,i2,...,im}为项(Item)的集合,D={T1,T2,...,Tn}D=...

2018-09-14 18:52:53

阅读数:33

评论数:0

数据挖掘概念与分析第十章笔记

聚类的基本概念和方法 什么是聚类?聚类是一个把数据对象集划分成多个组或簇的过程,使得簇内的对象具有很高的相似性,但是与其他簇中的对象很不相似。 对聚类分析的要求 书中介绍了很多的典型要求,其中有伸缩性,相似性度量,聚类空间等,总而言之,聚类算法具有多种要求。 基本的聚类方法有哪些? 1:...

2018-09-03 19:22:55

阅读数:17

评论数:0

数据挖掘概念与分析第九章笔记

原博主博客:https://blog.csdn.net/u014593570/article/details/75987793 本章学习数据分类的高级技术 贝叶斯信念网络 书上写的比较笼统,初学者可能会看的倒懂不懂的。因此,可以看看我在本章列出的参考文章。 1.1摘要  在上一篇文章中我们讨...

2018-09-01 09:24:03

阅读数:21

评论数:0

数据挖掘概念与分析第八章笔记

分类的基本概念 分类  分类是一种重要的数据分析形式,它提取刻画重要数据类的模型,这种模型称为分类器,预测分类(离散的,无序的)类标号。 分类和数值预测是预测问题的两种主要类型。 分类的一般方法  数据分类涉及两个过程: 1:学习阶段:建立描述预先定义的数据类或概念集的分类器。分类算法...

2018-08-23 11:09:30

阅读数:16

评论数:0

数据挖掘概念与分析第六章笔记

挖掘频繁模式 频繁模式是频繁地出现在数据集中的模式,主要包括频繁项集模式,频繁序列模式,和频繁结构模式。 我们先了解什么是项集,K-项集,数据集,绝对支持值的概念。书中都有讲解,这里简单的来说一下。 项集:最基本的模式就是项集,是指若干个项的集合 K-项集:包含K个项的项集 数据集:典型...

2018-08-20 14:52:24

阅读数:41

评论数:0

数据挖掘概念与分析第五章笔记

数据立方体技术 在第四章的时候我们提出了一种技术OLAP,并且指明数据立方体系统在各种粒度为多维数据的交互分析提供OLAP工具。虽然在第四章已经简要的介绍过数据立方体,但是并没有指明数据立方体是怎样实现的,这个章节我们将对完全立方体和部分立方体的物化技术进行讲解 基本概念 完全立方体:p12...

2018-08-17 15:39:25

阅读数:37

评论数:0

数据挖掘概念与分析第四章笔记

数据仓库与联机分析处理 构造数据仓库涉及数据清理,数据集成和数据变换 。那么什么是数据仓库呢? 数据仓库的定义很多,William H的说法是:数据仓库是一个面向主题的,集成的,时变的,非易失的数据集合,支持管理者的决策过程。数据仓库和数据库有什么不同? 名称 数据特点 技术 ...

2018-08-09 16:18:43

阅读数:42

评论数:0

数据挖掘概念与分析第三章笔记

数据预处理  数据预处理主要包括以下几步: 数据清理:可以用来清除数据中的噪声,纠正不一致 数据集成:将数据由多个数据源合并成一个一致的数据存储,如数据仓库,第四章会单独讲数据仓库 数据规约:可以通过如聚集,删除冗余特征或聚类来降低数据的规模 数据变换:可以用来把数据压缩到较小的空间,如...

2018-08-08 17:36:23

阅读数:144

评论数:0

数据挖掘概念与分析第二章笔记

本章主要是为了认识数据的属性和类型,为后面的数据预处理做知识准备 1:数据属性    ---是一个数据字段,表示数据对象的一个特征。有以下的属性类型 标称属性 标称属性的值是一些符号或事物的名称。每个值代表某种类别,编码或状态,因此标称属性又被看做是分类的。标称属性是定性的 二元属性 二元属...

2018-08-07 16:49:18

阅读数:55

评论数:0

python模拟get/post请求登录

今天学习了python模拟登陆,然后自己进行一下总结,以csdn登录为例子,浏览器为Chrome 1:直接携带cookie请求url地址 1.1cookie放在headers中 import requests #1.直接携带cookie请求URL地址 url="https:...

2018-07-31 16:18:34

阅读数:52

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭