- 博客(5)
- 资源 (110)
- 收藏
- 关注
原创 深入理解Aho-Corasick自动机算法
0.前言 我总是对那些具有状态转移过程的算法,心怀敬意。 例如:递归、递推、动规、DAT 以及现在要说的 AC 自动机算法。 数学真是优美! —— 致那些牛逼到不行的数学家们1.版权说明商业转载请联系作者获得授权,非商业转载请注明出处。本文作者:Q-WHai发表日期: 2015年...
2015-10-24 13:04:39 23541 7
原创 Trie树进阶:Double-Array Trie原理及状态转移过程详解
Trie树本身就是一个很迷人的数据结构,何况是其改进的方案。在本博客中我会从DAT(Double-Array Tire)的原理开始,并结合其源代码对DAT的状态转移过程进行解析。如果因此你能从我的博客中有所收获或启发,It's my pleasure.
2015-10-22 15:54:53 23492 7
原创 大数据算法:对5亿数据进行排序
0.前言:在大数据研究的路上,我们总要对一些很大的数据进行各种各样的操作。比如说对数据排序,比如说对数据统计,比如说对数据计算。而在大量的数据面前,我们总是束手无策,因为我们无法在限定时间的情况下,在效率上做到让人满意,也无法在限定空间的情况下,能够快速解决问题。可能我们在一些日常的开发过程中,没有遇到过这些问题。不过,现在是时候来考虑一下这样的问题了。因为,现在正值大数据的时代。在本文中...
2015-10-19 23:32:03 44579 8
原创 数据结构:字典树的基本使用
概述: 说来也奇怪,最近碰到的很多问题都需要用字典树来解决,索性就来研究一番。在这篇博客中,我会通过一些实例来讲解一下字典树的一些基本使用。例如:创建、添加、查找、按字典序排序、按数值大小进行排序(对于一些数值序列的排序)等等。关于字典的实际应用实例,请参见本人的另一篇博客:《算法:两种对拼音进行智能切分的方法》本文链接:http://blog.csdn.net/lemo...
2015-10-19 00:20:54 15618
原创 算法:两种对拼音进行智能切分的方法
前言: 最近在做一个调研的工作。研究的对象是搜索引擎中关键词的纠错功能。就像百度中搜索某一个关键词“ABC”,它会在搜索的结果中对此关键词进行纠正,然后会显示:你要找的是不是“ABD”。这种之类的。这个是背景,不过本文中还没不是介绍这一功能,这一功能的说明会在我的调研结束之后写在我的博客中。 本文要介绍的是,对拼音的拼写进行智能切分。比如:qinshimingyuezhijunlint...
2015-10-13 08:48:34 10051 3
Java设计模式-装饰者模式
2015-05-20
AndroidDemoRecyclerView
2015-05-18
MapReduce多路径输入输出
2016-06-18
RSA算法源码
2016-02-19
Java实现与FTP服务器的数据传输2
2015-11-12
Java实现与FTP服务器的数据传输
2015-11-11
Aho-Corasick自动机实现
2015-10-23
DoubleArrayTrie(双数组Trie树)
2015-10-22
字典树(Trie)的基本使用
2015-10-16
算法:Java对拼音进行智能切分
2015-10-13
模式匹配之KMP算法(Java版)
2015-09-16
获取网站标题和描述及对相关信息进行分词处理
2015-09-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人