elasticsearch获取分词结果

最新推荐文章于 2024-05-14 15:17:30 发布

模棱博客

最新推荐文章于 2024-05-14 15:17:30 发布

阅读量9.2k

点赞数 2

分类专栏： Elasticsearch 文章标签：模棱博客

本文链接：https://blog.csdn.net/qq_24501105/article/details/79389756

版权

Elasticsearch 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

原创于【模棱博客】

ES 中默认配置 IK 后，通过 Rest HTTP 的方式我们可以进行得到分词结果。

那么在 Spring Boot 和提供的客户端依赖 spring-data-elasticsearch 中如何获取到分词结果。

加入依赖 pom.xml

org.springframework.boot

spring-boot-starter-data-elasticsearch

在 application.properties 配置 ES 的地址：

# ES

spring.data.elasticsearch.repositories.enabled = true

spring.data.elasticsearch.cluster-nodes = 127.0.0.1:9300

然后创建一个方法，入参是搜索词，返回的是分词结果列表。

@Autowired

private ElasticsearchTemplate elasticsearchTemplate;

/**

* 调用 ES 获取 IK 分词后结果

*

* @param searchContent

* @return

*/

private List getIkAnalyzeSearchTerms(String searchContent) {

// 调用 IK 分词分词

AnalyzeRequestBuilder ikRequest = new AnalyzeRequestBuilder(elasticsearchTemplate.getClient(),

AnalyzeAction.INSTANCE,"indexName",searchContent);

ikRequest.setTokenizer("ik");

List ikTokenList = ikRequest.execute().actionGet().getTokens();

// 循环赋值

List searchTermList = new ArrayList<>();

ikTokenList.forEach(ikToken -> { searchTermList.add(ikToken.getTerm()); });

return searchTermList;

}

indexName 这里是指在 ES 设置的索引名称。

从容器注入的 ElasticsearchTemplate Bean 中获取 Client ，再通过 AnalyzeRequestBuilder 分析请求类型中进行分词并获取分词结果 AnalyzeResponse.AnalyzeToken 列表。

小结

默认配置了 IK 分词器，则 DSL 去 ES 查询时会自动调用 IK 分词。

如果想要自定义词库，比如比较偏的领域性。可以参考 Elasticsearch-analysis-ik GiHub 地址去具体查阅。

http://www.flammulina.com/2017/12/21/elasticsearch-%E8%8E%B7%E5%8F%96%E5%88%86%E8%AF%8D%E7%BB%93%E6%9E%9C/

模棱博客

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
elasticsearch获取分词结果

原创于【模棱博客】ES 中默认配置 IK 后，通过 Rest HTTP 的方式我们可以进行得到分词结果。那么在 Spring Boot 和提供的客户端依赖 spring-data-elasticsearch 中如何获取到分词结果。加入依赖 pom.xmlorg.springframework.bootspring-boot-starter-data-elasticsearch在 applicat...
复制链接

扫一扫