开源分词
ToBeAndNotToBe
这个作者很懒,什么都没留下…
展开
-
mmseg linux 安装指南
<br /># pwd<br />/usr/local [知道当前的安装目录]<br /># wget http://www.coreseek.cn/uploads/csft/3.1/Source/mmseg-3.1.tar.gz<br /># tar xzvf mmseg-3.1.tar.gz<br /># mkdir /usr/local/mmseg<br /># cd mmseg-3.1<br /># ./configure --prefix=/usr/local/mmseg<br /># make<原创 2010-10-25 13:04:00 · 2860 阅读 · 1 评论 -
开源分词框架分析
本文将带你一起了解搜索引擎神秘面纱中的一个重要部分---中文分词技术:主要讲述中文分词的实现原理和现今比较热门的几种搜索分词java版开源框架。任何一个全文搜索引擎都必须要在对索引处理之前进行一项重要的数据预处理工作:分词。分词的作用在于让机器能够更加容易的"学会"人类语言,搜索引擎才能展示出我们真正想要找的东西。当然,如果仅仅只是针对搜索这个应用场景,对外文(英文,俄文)的分词工作似乎轻而易举,原创 2011-06-28 19:08:00 · 6829 阅读 · 0 评论