ES分词及倒排索引使用记录

本文探讨了Elasticsearch在处理中文分词时的默认行为,指出如何通过配置IK分词器来改善搜索效果。同时,提到了term查询的限制,需要指定size属性以获取更多结果。了解这些技巧对于提升ES的检索效率至关重要。
摘要由CSDN通过智能技术生成

1.es默认分词器会将中文分成单个字,如“我爱北京”会被存储为“我”“爱”“北”“京”,当使用term搜索“北京”时是匹配不到的,因为倒排索引中只有“北”和“京”。可以在创建索引时指定分词器,如IK分词器
{
“mappings” : {
“esquestion” : {
“properties” : {
“id” : {
“type”: “text”
},
“question” : {
“type”: “text”,
"analyzer": "ik_max_word"
}
}
}
}
}’
参考ES倒排索引和分词
也可以使用es进行分词
{
“analyzer”:“ik_max_word”,
“text”:“你在干什么”
}’
2.es term查询结果默认只返回前10个,所以要加上size属性,指定返回个数

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值