算法设计
songjinbin
这个作者很懒,什么都没留下…
展开
-
正向最大匹配中文分词算法
中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。 在这里我想介绍一下中文分词的一个最基础算法:最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有两种:一种正向转载 2013-09-20 22:28:30 · 1792 阅读 · 0 评论 -
试着写 搜索算法-- 最大逆向匹配分词算法
最近想试着自己实现一些搜索算法,受到http://www.52nlp.cn/maximum-matching-method-of-chinese-word-segmentation这位大湿的一点启发,准备用JAVA把算法实现了一遍,代码写的有些简单,请各位大神指正, 正向最大匹配法算法思想如下所示:(注:以上最大匹配算法图来自于詹老师讲义) 逆向匹配法思想与正向一样,只是原创 2013-11-09 21:38:56 · 1137 阅读 · 0 评论 -
总结一些常用的排序算法,备忘
排序大的分类可以分为两种:内排序和外排序。在排序过程中,全部记录存放在内存,则称为内排序,如果排序过程中需要使用外存,则称为外排序。下面讲的排序都是属于内排序。 内排序有可以分为以下几类: (1)、插入排序:直接插入排序、二分法插入排序、希尔排序。 (2)、选择排序:简单选择排序、堆排序。 (3)、交换排序:冒泡排序、快速排序。 (4)、归并排序原创 2015-03-17 00:11:36 · 716 阅读 · 0 评论