中文分词
wzb56
never say die! never ever give up!
人活着,你也让别人活!
前半生不犹豫,后半生不后悔!
改变一生的无外乎两种东西:一是你读过的书,一是你遇到的人。
改变命运的无外乎两种东西:一是你读过的书,一是你遇到的人。
展开
-
免费的中文分词模块
免费的中文分词模块几个免费的中文分词模块 几个月前做毕业论文的时候需要用到中文分词技术,现在总结一下我所找到的资料。 一、什么是中文分词 众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子“I am a student”,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道“student转载 2012-07-16 17:43:25 · 8066 阅读 · 0 评论 -
一个简单最大正向匹配(Maximum Matching)MM中文分词算法的实现
1.构建词典内存树的TrieNode节点类: package cn.wzb.segmenter.mm.bean;import java.util.HashMap;/** * 构建内存词典的Trie树结点 * */public class TrieNode { /** 结点关键字,其值为中文词中的一个字 */ public char key = '\0'原创 2012-08-28 10:27:19 · 4353 阅读 · 0 评论