
中文分词
kwklover
这个作者很懒,什么都没留下…
展开
-
我开发的中文分词程序,开源发布
功能介绍:请参看花2周时间开发的中文分词终于有点小样了 (有些功能没体现出来)本中文分词是基于匹配模式开发的中文分词程序,为本人练手作品。也可以直接使用。但不建议。因为整体架构有一些基础性问题。不过做为开发中文分词的参考,相信还是有一定价值的。最近吕震宇老师发布了ICTCLAS的C#版SharpICTCLAS。很优秀的中文分词程序。我的这个和它根本不是一个级别的。不过在自己的应用中,估计还是不能直原创 2007-03-20 01:22:00 · 1872 阅读 · 0 评论 -
面向搜索的中文分词设计
我开发的中文分词程序,开源发布 ,其实哪个中文分词的整体架构是比较糟糕的。架构是否优秀决定了很多构思无法实现,思考了比较久,最近准备开发第二版,抛弃以前的架构,重新实现。下面是一些设计和构思。计划是两周时间开发完成beta版(如果因为工作关系,也有可能放弃),主要是希望和大家交流下设计思想,我觉得构思很重要,想得实现不了,可以慢慢研究,想不到才是头大的问题,希望能和大家一起交流下:新版中文分词构想原创 2007-08-25 03:50:00 · 1068 阅读 · 0 评论 -
Lucene.net常见功能实现知识汇总
在开发SearchEasy Site SearchEngine(搜易站内搜索引擎)的时候,经常会遇到一些搜索引擎的常见功能如何实现的问题,比如实现相关度百分比显示?如何实现在结果中搜索等等诸如此类常见的问题,本文总结我在开发SearchEasy Site SearchEngine(搜易站内搜索引擎)过程中遇到的问题,整理分享给需要的园友们: 问:Lucene.net的搜索结果的百分比相关度值原创 2013-08-25 15:22:35 · 1150 阅读 · 0 评论