elasticsearch
文章平均质量分 75
搜索引擎
zhaokuner
老程序员:
身是菩提树,心如明镜台,时时勤拂拭,莫使惹尘埃。
展开
-
docker启动elasticsearch问题
问题1:max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]答:在宿主机上修改echo "vm.max_map_count=262144" >> /etc/sysctl.confsysctl -w vm.max_map_count=262144https://www.elastic.co/guide/en/elasticsearch/reference/5原创 2021-10-20 12:50:30 · 534 阅读 · 1 评论 -
ElasticSearch——路由(_routing)机制
前言一条数据是如何落地到对应的shard上的?当索引一个文档的时候,文档会被存储到一个主分片中。 Elasticsearch 如何知道一个文档应该存放到哪个分片中呢?首先这肯定不会是随机的,否则将来要获取文档的时候我们就不知道从何处寻找了。实际上,这个过程是根据下面这个算法决定的:shard_num = hash(_routing) % num_primary_shards其中_routing是一个可变值,默认是文档的_id的值 ,也可以设置成一个自定义的值。 _rout...转载 2021-01-15 19:13:24 · 1329 阅读 · 0 评论 -
Elasticsearch-前缀、通配符、正则、模糊搜索详解
1.对于前缀的匹配搜索:GET /forum/article/_search{ "query": { "prefix": { "articleID": { "value": "J" } } }}prefix的匹配一般是处理不分词的场景,将会匹配articleID中以”J”开头的doc。prefix不会计算revelance score,只是作一个过滤的操作,和filter唯一的区别是filter会缓存结果,而prefix不会。前缀转载 2020-12-25 13:56:10 · 1177 阅读 · 0 评论 -
elasticsearch-aggs-top_hits,分组查询,并返回每组数据中特定排序的源数据
对数据分组并返回分组中特定排序的多少个Top Hits Aggregationtop_hits指标聚合器跟踪正在聚合的最相关文档。 此聚合器旨在用作子聚合器,以便可以按桶聚合最匹配的文档。top_hits聚合器可以有效地用于通过桶聚合器按特定字段对结果集进行分组。 一个或多个存储桶聚合器确定结果集被切入的属性。选项from - 要获取的第一个结果的偏移量。size - 每个桶返回的最大匹配匹配数的最大数量。默认情况下,返回前三个匹配的匹配。sort - 如何对最匹配的匹配进行排序。默.转载 2020-07-30 17:25:34 · 2850 阅读 · 1 评论 -
中文分词IK分词器使用经验
中文分词IK分词器//测试分词GET _analyze?pretty{"analyzer":"ik_smart","text":"中华人民共和国国歌"}analyzerik_smart 智能分词,最少切分,宁缺毋滥,保证查准率分词结果:中华人民共和国 国歌ik_max_word 最大化分词法,最细粒度划分,尽量多的有意义的分词,保证查全率贪心算法分词结果:中华人民共和国 中华人民 中华 华人 人民共和国 人民 共和国 共和 国 国歌ik_max_word 分词 包含原创 2020-05-13 16:24:59 · 533 阅读 · 0 评论 -
elasticsearch打分解析
默认得分按照逻辑关系命中后相加得分,查看数值,tfidf多少分,tfnorm归一化后多少分GET / demo_index/ _search { explain": true, "query": { "match": { "title": "标题" } }}// explain": true 这个显示具体得分是如何来的权重多字段查询时权重GET / demo_index / _search { "query": { "multi_match": { "原创 2020-05-12 18:58:30 · 888 阅读 · 0 评论