Algorithm
文章平均质量分 79
Fernando的十年
大数据,信息检索,云计算,在读研究生。
展开
-
prefixTreeEspan 频繁子树模式挖掘 A pattern growth 算法实现 mining embedded subtrees.
直接说这算法的作用吧,上图的右边就是左边图的 ES(Embedded Subtree),相对应的ABC-1D-1-1E-1-1就是上图左边的Pre-Order-String,也是这个算法输入的数据格式,中间我们用空格隔开(A B C -1 D -1 -1 E -1 -1),-1就是表示回走。这算法主要是用来挖掘频繁子树,也就是将一个树里的所有频繁子树找出来。原理就不说了,大家可以自原创 2014-11-21 16:14:26 · 2640 阅读 · 3 评论 -
Adaboost
Boosting是一种贪心的自适应基展开算法。基本思想:——构造一个性能很高的预测是一件很困难的事情——但是构造一个性能一般的预测并不困难。Boosting就是基于上述观察结论,将一些弱规则组合得到最后一个强规则,这个最后的强规则比任何单个规则性能都高得多。 Adaboost。它的自适应在于:前一个基本分类器分错的样本会得到加强,加权后的全体样本再原创 2014-12-04 23:10:05 · 759 阅读 · 0 评论 -
子图同构算法Ullmann实现,并采取了Refinement(java语言)
用java实现子图同构算法Ullmann,并采取了refinement来提高效率。原创 2015-01-15 19:56:52 · 3232 阅读 · 3 评论 -
EM算法
本文转自JerryLead。转载 2014-11-30 10:59:52 · 491 阅读 · 0 评论 -
Trie树的Java实现
第一部分、Trie树1.1、什么是Trie树 Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。 Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到原创 2016-03-12 14:01:24 · 2125 阅读 · 0 评论