自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 c++ 统计英文文本中每个单词的词频并且按照词频对每行排序

前几天写了Apriori算法之后效率很差,在网上查了很多资料,另外的最大模式挖掘算法一般有FP-Growth 和 Ecalt 算法,这两种效率比较高而FP-Growth算法构建FP-Tree的过程非常复杂,后来在网上找到了另外一种效率更优化且结构更简单的算法,那就是北大邓志鸿老师的PPV算法,看了论文以后觉得这确实是一个好的算法,因此打算加以实现。在实现的第一步就卡住了。在构造PPV-TREE/

2013-04-02 20:52:41 6640 2

原创 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和图片上传 LaTex数学公式 UML序列图和流程图 离线写博客 导入导出Markdown文件 丰富的快捷键 快捷键 加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2015-10-29 15:40:29 357

原创 MAX-MINER 频繁模式挖掘 Apriori算法

这几天小白让我做一个max-miner 最大项集的挖掘,一般的算法有apriori和FP-TREE 考虑到用FP-TREE 可能有点复杂就用apriori算法先测试下,在小样本测试的时候速度非常快,当对一个5W行的文本测试效率变得不可承受了,因此对算法进行了分析,假设每行有100个单词当用apriori算法对3-候选集进行count的时候每一个候选集需要: 5W * 100*3 = 1500W

2013-03-30 16:07:16 2289 1

原创 #面试编程题# 一个LIS 问题

原题目: #面试编程题# Given a array of integers , find 3 indexes i,j,k such that, i  < a. Could you find possible iO(n) algorithm. 来源:http://weibo.com/1915548291/zpuaLlfh5#_rnd1364438221023 使用LIS 找3个长度的递

2013-03-28 11:18:28 628

原创 一个双向链表+Vector查找

题目是有一堆DoubleLinkedList,然后有一个vector记录了其中的一些节点(可能是中间的某个节点),找出vector中包含的独立DoubleLinkedList的个数。 思想是利用了双链表的性质可以前后查找。因此在Vector中前后走动找到head或者tail为止时间复杂度为O(NLOGN) 代码如下: #include #include using names

2013-03-19 10:33:56 985

max-miner 极大模式挖掘的ppv-al完整代码

max-miner 极大模式数据挖掘的ppv-al完整算法

2013-08-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除