Elasticsearch: 权威指南 学习
树叶要走风怎么挽留
六块腹肌的程序员小哥哥
展开
-
Elasticsearch: 权威指南 » 处理人类语言 » 开始处理各种语言 分词学习!****
自定义分词器测试! 创建一个索引,并自定义分词器 自定义一个分词器,名字为my_custom_analyzer 指定他为自定义分词器(type=custom) 指定他的char_filter 为my_charfilter(自定义产生,会对查询词进行预处理),指定他的分词方式为my_tokenizer(自定义的分词方式),指定一个结果过滤器(会去除调指定不需要的词项) PUT test_index { "settings": { "analysis": { "analyzer": {原创 2020-06-17 16:24:51 · 145 阅读 · 0 评论 -
Elasticsearch: 权威指南 » 深入搜索 » 控制相关度 学习
###Elasticsearch: 权威指南 » 深入搜索 » 控制相关度 »查询时权重提升 学习 多个索引同时进行搜索时,可以通过indices_boost 提升索引权重,wbswxx中索引的文件的权重是2,tlsmz的为3,其他匹配的索引权重为默认值1 GET tlsmz,hotel,wbswxx/_search { "explain": true, "indices_boost": [ { "wbswxx": 2 }, { "tlsmz":3原创 2020-06-17 14:01:23 · 133 阅读 · 0 评论 -
Elasticsearch: 权威指南 » 深入搜索 » 控制相关度 » 相关度评分背后的理论 学习
Elasticsearch: 权威指南 » 深入搜索 » 控制相关度 » 相关度评分背后的理论 学习 ##词频/逆向文档频率(TF/IDF) ##当匹配到一组文档后,需要根据相关度排序这些文档,不是所有的文档都包含所有词,有些词比其他的词更重要。一个文档的相关度评分部分取决于每个查询词在文档中的 权重 。 ##词频 ##词在文档中出现的频度是多少?频度越高,权重 越高 。 5 次提到同一词的字段比只提到 1 次的更相关。词频的计算方式如下: ##tf(t in d) = √frequency ##词 t原创 2020-06-16 09:10:34 · 129 阅读 · 0 评论 -
Elasticsearch:权威指南学习之多字段映射
多字段映射 ,指定title为english分词, title.std为standard分词。进行多次索引 PUT /my_index { "settings": { "number_of_shards": 1 }, "mappings": { "properties": { "title": { "type": "text", "analyzer": "english", "fields": { "原创 2020-06-15 16:01:50 · 346 阅读 · 0 评论 -
elasticsearch得分设置以及分词器不同层次定义
GET _cat/indices GET hotel/_search GET /_search { "query": { "constant_score": { "filter": { "term": { "lvg_mc": "酒店" } }, "boost": 1.2 } } } DELETE /my_index PUT /my_index { "settings": { "numbe原创 2020-06-12 17:02:37 · 1045 阅读 · 0 评论 -
Elasticsearch: 权威指南 学习索引别名和结构化查询练习
索引别名和零停机 创建一个索引 PUT my_index_v1 查询索引信息 GET my_index_v1 给my_index_v1索引指定一个索引别名my_index_v2 PUT my_index_v1/_alias/my_index_v2 查看my_index_v1的详情信息 GET my_index_v1 查看别名my_index_v2 指向了哪一个索引 GET /*/_alias/my_index_v2 查看my_index_v1有哪些别名 GET /my_index_v1/_alia原创 2020-06-08 17:35:50 · 177 阅读 · 0 评论