- 博客(6)
- 收藏
- 关注
原创 FP-growth算法应用实例(基于python)
我把关于FP-Growth的算法原理,python实现代码,以及代码解读放在了另外一篇文章:有兴趣可以看看。这篇文章给出该算法的一个很酷的实例应用。我们将用到一个叫 kosarak.dat 的数据集,可以从这里下载。这份数据集包含将近100万条记录,对于展示FP-Growth算法的速度十分有效。该文件的每一行包含某个用户浏览过的新闻报道。用户和报道被编码成整数。为了看起来方便,还是先放一下...
2018-11-05 19:16:27 6192 2
原创 Apriori原理及python实现
相信大家都听说过“啤酒与尿布“的经典案例,分析人员通过对一家商店大量的商品购买记录进行分析后发现,啤酒与尿布经常一起被购买。这种神奇的组合我们单从肉眼上可能很难发现,这个案例用到的算法就是Apriori算法。该算法能够帮助我们发现频繁项集和挖掘关联规则,频繁项集是指那些经常出现在一起的物品组合。案例中的{啤酒,牛奶}就是频繁项集。关联规则暗示两种物品之间可能存在很强的关系。举个例子说明与Apr...
2018-11-05 14:51:55 1294
原创 FP-growth算法原理及python实现(详细代码解释)
目录算法简介构建FP树挖掘频繁项集算法简介FP-growth算法的应用我们经常接触到。比如,你在百度的搜索框内输入某个字或词,搜索引擎会自动补全查询词项,而这些词项都是和搜索词经常一起出现的。 FP-growth算法被用来挖掘频繁项集,也就是说从已给的多条数据记录中挖掘出哪些项是频繁一起出现的。该算法适用于标称型数据,即离散型数据。它比Apriori算法更高效,因为该算...
2018-11-02 17:11:28 19625 13
原创 哈夫曼编码原理了解一下
什么是哈夫曼编码呢?这种编码方法在1952年由美国计算机科学家戴维·哈夫曼先生提出,它是一种数据压缩技术。这是一种很著名的编码方法哦,我们来了解一下吧。为啥说它是一种数据压缩技术呢,这完全因为它的编码思想:根据字符出现的概率大小进行编码,出现概率高的字符使用较短的编码,出现概率低的字符使用较长的编码。我们可以想一下,假设有一段文本,我们要给里面的每个字符都编码,对于一个出现概率很高的字符,如果我们...
2018-06-14 21:27:16 14550 1
转载 实验三 信道建设
实验的目的和要求了解信道的含义、信源编码的流程,熟练掌握整数、小数的十进制和二进制的互换机制,并能编程实现。考核要求熟悉并掌握十进制与二进制小数的互转机制,并分析算法产生的误差 实验内容:1、编写程序实现十进制小数x=0.7 的二进制转换,并分析其误差(即重新将二进制小数转成十进制小数,和原十进制小数进行比较。)2、编程实现十进制数 x=5.9的二进制转换。%%%第一题clear allcl...
2018-06-11 16:44:12 551
转载 实验二 构建信源模型
实验的目的和要求 正确理解信息科学的基本概念——信源;基于给定材料,构建合理的信源数学模型,并用MATLAB完成建模过程。该部分实验涉及数据读入(文档读写、图像读写)、概率统计等等。实验内容:1、随机产生一个一行五列数组,使其恰好符合信源概率的要求;2、基于给定英文材料,以26个英文字母为信源消息符号,构建该信源的数学模型。1)统计26个英文字母出现的频数;2)计算26个英文字母出现的频率,并...
2018-06-10 15:57:53 1894
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人