ikanalyzer
文章平均质量分 89
zhan19861022
这个作者很懒,什么都没留下…
展开
-
门户社区站内检索技术预研
最近要负责处理门户社区类系统的站内各类资源搜索部分,根据大数据量和复杂搜索种类,计划采用目前基于开源的apache lucene项目组件的apache solr搜索引擎与门户社区相结合使用,后续会陆续编写各个组件的预研。 预研之后,暂定方案,具体信息后续博客会加以说明: JVM环境:ibmjdk5(强制要求,无奈) lucene3.6.1GA:支持jdk5的最后一个版本 solr3.6.1原创 2012-11-06 21:27:03 · 373 阅读 · 0 评论 -
lunece的第三方中文分词器预研
一、当前主流的一些中文分词介绍(转) 1、 StopAnalyzer StopAnalyzer能过滤词汇中的特定字符串和词汇,并且完成大写转小写的功能。 2、 StandardAnalyzer StandardAnalyzer根据空格和符号来完成分词,还可以完成数字、字母、E-mail地址、IP地址以及中文字符的分析处理,还可以支持过滤词表,用来代替StopAnalyzer能够实现的过滤功原创 2012-11-08 21:25:38 · 1737 阅读 · 0 评论