- 博客(9)
- 资源 (12)
- 问答 (1)
- 收藏
- 关注
原创 FP-Growth算法的介绍
引言:在关联分析中,频繁项集的挖掘最常用到的就是Apriori算法。Apriori算法是一种先产生候选项集再检验是否频繁的“产生-测试”的方法。这种方法有种弊端:当数据集很大的时候,需要不断扫描数据集造成运行效率很低。 而FP-Growth算法就很好地解决了这个问题。它的思路是把数据集中的事务映射到一棵FP-Tree上面,再根据这棵树找出频繁项集。FP-Tree的构建过程只需要扫描两次数据集。
2015-06-28 10:31:45 25913 5
原创 Apriori算法的介绍
前言:数据挖掘中的关联分析可以分成频繁项集的挖掘和关联规则的生成两个步骤,而Apriori算法是找频繁项集最常用到的一种算法。 关于关联分析和频繁项集请见:什么是关联分析? 中言:我们还是利用购物篮的例子来讲述Apriori算法的思路。 购物篮信息如下: TID Items 001 Cola, Egg, Ham 002 Cola, Diaper, Bee
2015-06-27 13:32:24 11966
原创 什么是关联分析?
引言:在认识什么是关联分析之前,先了解一下关联分析能用来干什么吧: 示例1:如下是一个超市几名顾客的交易信息。 TID Items 001 Cola, Egg, Ham 002 Cola, Diaper, Beer 003 Cola, Diaper, Beer, Ham 004 Diaper, Beer TID代表交易流水号,Items代
2015-06-26 13:06:29 14618
原创 python元组、列表的异同总结
定义的异同:列表(list):[]\color{blue}{[ ]}list是一种有序的集合,可以随时添加和删除其中的元素,用 [] 表示。 列表的三个特性:①创建之后也可以加减修改元素; ②元素可以是数字、字符、变量等,也可以混杂; ③列表可以嵌套。 例如:>>>f=3>>>list_example = [1, 'dog', f, ['monkey', 'duck']]>>>list_ex
2015-06-25 10:04:22 3440
原创 CSDN-Markdown语法集锦
前言:使用Markdown近一个来月,越来越觉得不舒爽! 改字体、改字号、改颜色、改样式,全不会!想加个数学公式,得,只会截图。把图片传上去了还不会控制大小,也不会控制文字与图片的排版,写出来的博客怎么看都还是有点丑!今天真忍不住了,这内容不咋地也就算了,排版也给弄漂亮点吧!今晚要搜遍网上各种关于Markdown语法的文章,作个总结! 表格:标题1|标题2|标题3 ---:|:-----:
2015-06-07 15:17:37 4890 3
原创 朴素贝叶斯
朴素贝叶斯算法是一种基于概率统计的分类方法,它主要利用贝叶斯公式对样本事件求概率,通过概率进行分类。以下先对贝叶斯公式做个了解。 贝叶斯公式条件概率:对于事件A、B,若P(B)>0,则事件A在事件B发生的条件下发生的概率为: P(A|B)=P(AB)P(B)P(A|B) = \frac{P(AB)}{P(B)}贝叶斯公式:将条件概率稍作转化即可得到贝叶斯公式如下: P(A|B)=P(B|A
2015-06-05 18:49:22 2650
原创 哲学家就餐问题
问题描述:五个哲学家(A~E)围着一张圆桌就餐,他们每个人面前都有一盘通心粉。由于通心粉很滑,所以需要两只筷子才能夹住,但每两个盘子之间只放着一只筷子,如下图。 哲学家只有两个动作:要么就餐,要么思考。而且他们之间从不交谈。 当一个哲学家饿了的时候,就拿起盘子左右两边的筷子开始就餐(不能同时拿起两只筷子)。就餐完以后,就把筷子放回盘子左右,继续思考。 由于他们之间互不交谈,所以很容易出现“死锁
2015-06-04 15:42:55 8116 2
原创 决策树之 ID3
ID3 是一种用来构建决策树的算法,它根据信息增益来进行属性选择。 关于决策树,请参见:http://blog.csdn.net/bone_ace/article/details/46299681 此处主要介绍 ID3 算法如何利用信息增益选择属性。 信息增益的计算:信息熵:信息熵,简称“熵”。假定训练集中目标属性为CC,CC 的取值为:C1,C2,…,CmC_1,C_2,…,C
2015-06-01 16:00:44 4362
原创 决策树
在众多分类算法中,决策树应该是最基本的一种算法了,也是相对比较简单的一种算法。 决策树的介绍:首先,什么叫做决策树?决策树用于解决什么样的问题?先看一个例子: 现有某银行客户拖欠贷款的历史数据,如表 3-1。现在一个新客户{ no, married, 80K, ? } 前来申请贷款,请你根据银行的历史数据判断这个人会不会拖欠贷款? 当然,客户最终是否会拖欠贷款,我们是无法100%确定的。但
2015-06-01 08:18:09 2809
Python2.7.14 for windows64位 最新版下载
2017-10-19
phantomjs-2.1.1-linux-x86_64.tar.bz2
2016-11-25
SublimeText3工具箱
2015-12-30
FP-Growth算法python实现(完整代码)
2015-07-04
广工数据挖掘12、13、14年试题+课后答案+知识点总结+上课PPT+课外资料
2015-06-15
求三个很简单的 Oracle 语句(只是因为英文题目,看着有点晕而已)
2015-10-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人