一、lucene+盘古分词

Lucene.Net只是一个全文检索开发包。它的功能就是提供了全文检索功能的一个数据库。Lucene.Net不管文本数据怎么来的,用户可以基于Lucene.Net开发满足自己需求的搜索引擎。Lucene.Net智能对文本信息进行检索。如果不是文本信息,要转换为文本信息,比如检索Excel文件,就要用NPOI把Excel读取成字符串,然后把字符串扔给Lucene.Net。Lucene.Net会把扔给它的文本切词保存,加快检索速度。

盘古分词使用方法:
将Dict文件夹放置项目根目录,并将其下文件"复制到输出目录"属性设置为"如果较新则复制"
引用PanGu.dll与PanGu.Lucene.Analyzer.dll类库即可使用盘古分词算法
添加引用:PanGu.HighLight.dll

  lucene 官方网站Luncene.net 官方网站(英文) 这两个网站大家应该都知道了,里面还有一个邮件列表,有兴趣可以加入这个邮件列表,这样就可以和全球的爱好者一起来讨论Lucene.net的相关问题了。
    中文资源
    博客园 lucene.net 讨论小组 一个园子里面的,当然要重点推荐一下了。
    博客园 搜索引擎讨论小组 我创建的小组,主要讨论搜索引擎技术,数据挖掘技术和中文分词技术,由于和lucene高度相关,所以一些lucene的问题也会在这个小组中进行讨论。
    Nutch中文网论坛 Lucene学习资料
    JavaEye lucene爱好者

 

    英文资源   

  lucene apache 组织中的 wiki 这个网址有很多lucene 的相关资源

    lucene 的英文博客网站 这个是lucene的鼻祖Doug Cutting的Blog   

  维基百科Lucene相关的介绍   

  Lucene forum at nabble.com   

  http://groups.drupal.org/lucene-and-nutch

    http://lucene.grantingersoll.com/

    Lucene.Net Resource List – Books, links and API’s

 

转载于:https://www.cnblogs.com/enjoy1129/p/5310205.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值