使用IKAnalyzer3.2.3分词器提取标题关键词

最新推荐文章于 2024-07-07 01:39:48 发布

iteye_15857

最新推荐文章于 2024-07-07 01:39:48 发布

阅读量636

点赞数

分类专栏： java/jsp 文章标签： lucene Apache JSP Web XML

本文链接：https://blog.csdn.net/iteye_15857/article/details/81892000

版权

java/jsp 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

由于C2C的商城要实现一个简单的商品关键词搜索，建立关键词和商品的映射表需要先对商品标题自动提取关键词，

故用了lucene Analyzer\IKAnalyzer3.2.3做测试，对标题进行关键词切分.

感觉还是IKAnalyzer的分词比较贴切些。

直接附上jsp测试代码:

<%@page contentType="text/html; charset=UTF-8" pageEncoding="UTF-8" buffer="2kb" session="false" autoFlush="true"%>
<%@page import="java.io.*,
        org.apache.lucene.analysis.*,
        org.apache.lucene.analysis.TokenStream,
        org.apache.lucene.analysis.tokenattributes.TermAttribute,
        org.wltea.analyzer.lucene.IKAnalyzer,
        org.apache.lucene.util.*
"%>
<%
IKAnalyzer ka = new  IKAnalyzer(true);
String s = "发布IKAnalyzer中文分词器 - Java、咖啡与茶";
Reader r = new StringReader(s);
TokenStream ts = (TokenStream)ka.tokenStream("title", r);
ts.addAttribute(TermAttribute.class);
        while (ts.incrementToken()) {
               TermAttribute ta =ts.getAttribute(TermAttribute.class);
               out.print(ta.term());
               out.print(" | ");
        } 

%>

IKAnalyzer.cfg.xml放在 WEB-INF/classes/下，自定义的字典文件也在这个目录下

测试效果如:

当然要用在商城里，我还需要扩展一个商品品牌相关的字典

在此十分感谢作者提供了这么好的一个插件.

iteye_15857

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
使用IKAnalyzer3.2.3分词器提取标题关键词

由于C2C的商城要实现一个简单的商品关键词搜索，建立关键词和商品的映射表需要先对商品标题自动提取关键词，故用了lucene Analyzer\IKAnalyzer3.2.3做测试，对标题进行关键词切分.感觉还是IKAnalyzer的分词比较贴切些。直接附上jsp测试代码:&lt;%@page contentType="text/html; charset=UTF-8" pageEn...
复制链接

扫一扫