FP-growth算法发现频繁项集(二)——发现频繁项集

上篇介绍了如何构建FP树,FP树的每条路径都满足最小支持度,我们需要做的是在一条路径上寻找到更多的关联关系。 抽取条件模式基   首先从FP树头指针表中的单个频繁元素项开始。对于每一个元素项,获得其对应的条件模式基(conditional pattern base),单个元素项的条件模式基也就...

2019-06-05 16:28:48

阅读数 37

评论数 0

FP-growth算法发现频繁项集(一)——构建FP树

常见的挖掘频繁项集算法有两类,一类是Apriori算法,另一类是FP-growth。Apriori通过不断的构造候选集、筛选候选集挖掘出频繁项集,需要多次扫描原始数据,当原始数据较大时,磁盘I/O次数太多,效率比较低下。FPGrowth不同于Apriori的“试探”策略,算法只需扫描原始数据两遍,...

2019-06-05 16:26:59

阅读数 24

评论数 0

Jaccard系数

Jaccard index, 又称为Jaccard相似系数(Jaccard similarity coefficient)用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。 定义 给定两个集合A,B,Jaccard 系数定义为A与B交集的大小与A与B并集的大小的...

2019-06-05 13:04:40

阅读数 56

评论数 0

对称函数、半正定矩阵(核函数涉及)

一、对称函数 在对称函数中,函数的输出值不随输入变数的排列而改变。从函数的形式中可以看出若输入变数排列后,方程式不会改变。例如对于一个球体.若 φ 为其方位角,θ为其天顶角,r为半径,则大圆距离可以表示为 根据上述的距离公式,可以看出一些对称性,在以下变换下,距离不变: 天顶角各加某特...

2019-04-14 16:56:43

阅读数 256

评论数 0

遗传算法-简介

遗传算法(Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。遗传算法是从代表问题可能潜在的解集的一个种群(population)开始的,而一个种群则由经过基因(gene)编码的一定数目的个体(ind...

2019-04-10 12:40:54

阅读数 28

评论数 0

生物神经元

人脑大约由140亿个神经元组成,神经元互相连接成神经网络 神经元是大脑处理信息的基本单元,以细胞体为主体,由许多向周围延伸的不规则树枝状纤维构成的神经细胞,其形状很像一棵枯树的枝干。它主要由细胞体、树突、轴突和突触(Synapse,又称神经键)组成。 ...

2019-03-27 12:49:56

阅读数 166

评论数 0

线性判别分析(LDA):样本中心投影的推导

以平面二维为例: 设为样本中心点,LDA直线为, 投影直线的斜率与LDA直线垂直,斜率为,求得直线: 直线与LDA直线的交点,即是样本中心在直线上的投影点: 解得投影点: 所以,距离为: 第三步,把分子x0+y0·W写成了两个向量内积的形式, 分母就是(1,W)这个向...

2019-03-22 12:26:03

阅读数 82

评论数 0

协方差矩阵

在统计学与概率论中,协方差矩阵的每个元素是各个向量元素之间的协方差,是从标量随机变量到高维度随机向量的自然推广。 概念 设 为n维随机变量,称矩阵 为n维随机变量 的协方差矩阵(covariance matrix),也记为 ,其中 为 的分量 和 的协方差(设它们都存在)。 ...

2019-03-22 10:53:17

阅读数 45

评论数 0

最小描述长度( MDL)

最小描述长度( MDL) 原理是Rissane在研究通用编码时提出的。其基本原理是对于一组给定的实例数据 D,如果要对其进行保存,为了节省存储空间,一般采用某种模型对其进行编码压缩,然后再保存压缩后的数据。同时,为了以后正确恢复这些实例数据,将所用的模型也保存起来。所以需要保存的数据长度(比特数)...

2019-03-19 19:40:56

阅读数 146

评论数 0

动态规划算法:汽车装配线调度问题

1 问题描述 某个汽车工厂共有两条装配线,每条有 n 个装配站。装配线 i 的第 j个装配站表示为 Si,j,在该站的装配时间为 ai,j。一个汽车底盘进入工厂,然后进入装配线 i(i 为 1 或 2),花费时间为 ei。在通过一条线的第 j 个装配站后,这个底盘来到任一条装配线的第(j+1)个...

2019-03-18 22:02:01

阅读数 96

评论数 0

利用信息熵构建决策树

决策树算法普遍存在于我们的日常生活中,我们在不经意间就会使用到决策树。比如你在纠结是否要去一家公司工作时,可能会用到下面的决策树: 整个决策过程是这样的:如果公司待遇高,你可能就愿意去;如果待遇不高,你可能会继续考虑公司的平台好不好。如果连平台都不好,那就直接拒绝。如果平台很好,你就会继...

2019-03-13 21:16:34

阅读数 103

评论数 0

Python3---函数(高级、作用域)

4.函数-高级 (1)偏函数:原函数中部分拥有固定值的参数另外单独定义为一个函数 (2)高阶函数:参数是函数 (3)返回函数:返回值为函数 (4)匿名函数:也称lambda函数 (5)闭包 (6)装饰器:格式必须要与被装饰的函数一致! 注意:上...

2019-03-06 20:50:57

阅读数 112

评论数 0

Python3---函数(定义、参数、返回值)

九、函数 1.函数的概念和定义 2.函数的参数 3.函数的返回值

2019-03-06 20:48:35

阅读数 93

评论数 0

Python3常用数据类型---时间日历

8.时间日历

2019-03-06 20:43:59

阅读数 41

评论数 0

Python3常用数据类型---集合

7.集合 注意:列表可以直接生成集合,但不能作为集合的元素!! (1)单一集合操作 (2)集合之间操作

2019-03-06 20:41:42

阅读数 30

评论数 0

Python3常用数据类型---字典

6.字典:无序的、可变的键值对集合 注意:无序:表明不能通过索引来访问字典;字典是键值对集合,而非元素集合。 (1)字典常用操作—增 (2)字典常用操作—删 (3)字典常用操作—改 (4)字典常用操作—查 ...

2019-03-06 20:32:59

阅读数 40

评论数 0

Python3常用数据类型---元组

5.元组:有序的不可变的元素集合 注意:由于元组中的元素是不可变的,所以不能对其进行增-删-改!! 注意:在比较时,若是同类型数据,则直接比较数值;若不是,但其中一个为数值类型,则解释器在处理过程中会先把其转换成数值类型再比较;若两者既不是同类型数据,也不是数值类型,则直接比较两者...

2019-03-06 20:30:08

阅读数 36

评论数 0

Python3常用数据类型---列表

4.列表:强调独立个体,指有序、可变的元素集合 (1)列表常用操作—增 (2)列表常用操作—删 (3)列表常用操作—查 (4)迭代器简单实用 (5)列表常用操作—额外操作(判定、比较、排序、乱序、反转) ...

2019-03-06 20:19:17

阅读数 43

评论数 0

Python3常用数据类型---字符串

3.字符串:强调整体,个体字符不可改 (1)字符串函数操作—查找计算 (2)字符串函数操作—转换 (3)字符串函数操作—填充压缩 (4)字符串函数操作—分割拼接 可迭代的对象:可用循环进行遍历的对象 (5)字符串函...

2019-03-06 20:14:51

阅读数 65

评论数 0

教你pe系统bootice修复系统引导教程

总所周知,bootice是一款用于安装、修复兼恢复磁盘等操作工具。当很多用户遇到电脑系统引起的问题时,需要u盘安装系统之前就可以先使用bootice工具对系统进行修复和引导的操作。而今U盘装大师也附带了这样一款工具,接下来就为大家详细介绍pe系统使用bootice工具进行系统修复引导的操作方法。 ...

2019-02-28 19:44:35

阅读数 458

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭