Elasticsearch 的使用

Install

参考

https://www.elastic.co/guide/en/elasticsearch/reference/8.0/install-elasticsearch.html
https://www.elastic.co/guide/en/elasticsearch/reference/8.0/targz.html


Elasticsearch 版本:6.8.8

文章参考如下链接,但有些内容可能过时,以实践结果为主:

https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html

Index API

创建 index
PUT http://localhost:9200/twitter

PUT http://localhost:9200/twitter/tweet/1

自动索引创建
如果索引不存在,会自动创建,并使用一些默认的索引模板

Get API

GET http://localhost:9200/twitter/tweet/1

Delete API

DELETE http://localhost:9200/twitter/tweet/1

Delete By Query API

POST http://localhost:9200/twitter/_delete_by_query

{
  "query": { 
    "match": {
      "message": "some message"
    }
  }
}

查询在传值的时候必须用 query 作为 key

Search APIs

所有的搜索 API 可以在一个 index 中跨越多个 type 进行使用,也可跨越多个索引。

例如,我们可以在 twitter 索引上跨越所有 type 搜索所有 document:
GET /twitter/_search?q=user:kimchy

我们也可以指定多个类型:
GET /twitter/tweet,user/_search?q=user:kimchy

跨越多个 index 搜索指定 type,指定标签:
GET /kimchy,elasticsearch/tweet/_search?q=tag:wow

搜索所有 index 指定 type,用 _all 代表所有 index
GET /_all/tweet/_search?q=tag:wow

搜索所有 index 所有 type
GET /_search?q=tag:wow

Query String 语法
查询字符串被解析为一系列 term 和 operator。一个 term 可以是一个单词 —— quick 或者 brown;或者是一个短语,被双引号包裹 —— “quick brown”,以相同的顺序搜索短语中的所有单词。

Field names

status 包含 active

status:active

title 包含 quick 或者 brown。如果你省略 OR,使用默认的操作符

title:(quick OR brown)
title:(quick brown)

author 包含 “john smith”

author:"John Smith"

任意字段 book.title, book.content 或者 book.date 类似,包含 quick 或者 brown

book.\*:(quick brown)

字段 title 有非空值

_exists_:title

通配符

通配符搜索可以在单个 term 上运行,使用 ? 代表一个单个字符,使用 * 代表 0 个或多个字符:

qu?ck bro*

但是注意,通配符查询会使用大量内存,并且表现糟糕,

注意:单纯的通配符 * 为了提高效率,会被重写为 exists 查询。因此,通配符 "field:*" 将会匹配下面有空值的 document:

{
	"field": ""
}

并且如果字段不存在或者设置为 null,将不会被匹配:

{
	"field": ""
}

正则表达式

通过包裹斜杠("/")可以将正则表达式嵌入查询字符串中:

name:/joh?n(ath[oa]n)/

模糊查询

使用模糊运算符来搜索相似的 term:

quikc~ brwn~ foks~

使用 Damerau-Levenshtein 距离来查找最多两个更改,其中的更改时单个字符的插入,删除或者替换,或者相邻字符的换位

默认的编辑距离是 2,但编辑距离为 1 应足以捕获所有人类拼写错误的 80%。它可以指定为:

quikc~1

范围查询

范围可以是日期,数字或者字符串。左右闭区间使用方括号 [min TO max] 左右开区间使用花括号 {min TO max}

  • 2012 所有的天
date:[2012-01-01 TO 2012-12-31]
  • 数字 1-5
count:[1 TO 5]
  • 标签在 alpha 和 omega 之间,不包括 alpha 和 omega
tag:{alpha TO omega}
  • 数字 10 以上
count:[10 TO *]
  • 2012 年之前
date:{* TO 2012-01-01}

方括号和花括号也可以组合

  • 数字1 到 5,但不包括 5
count:[1 TO 5}

有一侧无界可以使用以下语法:

age:>10
age:>=10
age:<10
age:<=10

Boolean 运算符

默认,所有 term 都是可选的,只要一个 term 匹配即可。搜索 foo bar baz 将会找到所有包含一个或多个 foo 或 bar 或 baz 的文件。
首选运算符 + (该 term 必须出现)和 - (该 term 禁止出现)。所有其他术语都是可选。例如:

quick brown +fox -news
  • fox 必须出现
  • news 禁止出现
  • quick 和 brown 是可选的

Simple Query String Query

这是一种使用 SimpleQueryParser 解析上下文的查询方式。与常规的 query_string 查询不同的是,simple_query_string 查询不会抛出异常,并且会丢弃查询的无效部分,比如下面这个例子:
GET /_search

{
  "query": {
    "simple_query_string" : {
        "query": "\"fried eggs\" +(eggplant | potato) -frittata",
        "fields": ["title^5", "body"],
        "default_operator": "and"
    }
  }
}

Simple Query String 语法

simple_query_string 支持如下特定字符:

  • + 表示 AND
    |

GET /_search

{
    "query": {
        "simple_query_string" : {
            "fields" : ["content"],
            "query" : "foo bar -baz"
        }
    }
}

如果你希望得到包含 “foo” 或者 “bar”,但是不能包含 “baz”,由于 default_operator 是 OR,那么这其实意味着:匹配包含 “foo” 或者包含 “bar” 或者不包含 “baz”。显然,这不是所希望的,那么查询可以写成 "foo bar +-baz",这样就不会返回包含 “baz” 的 document 了。

默认字段

在查询字符串语法中,未指定搜索的字段时,index.query.default_field 将用于得到哪个字段需要搜索。它默认是 *,并且查询将会自动尝试去确定 index 的 mapping 中可查询的存在字段,然后在这些字段上执行搜索。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: Elasticsearch 是一个流行的开源搜索引擎,广泛用于全文搜索、日志分析和数据可视化等领域。使用 Elasticsearch 可以帮助用户快速存储、搜索和分析大量的数据。 要使用 Elasticsearch,首先需要安装 Elasticsearch 和 Kibana(一个数据可视化工具)。然后,可以使用 Elasticsearch 的 API 来创建索引、添加文档、执行搜索和聚合等操作。 在创建索引时,需要定义索引的结构(即 mapping),包括字段类型、分析器和索引设置等。在添加文档时,可以将 JSON 格式的数据插入到索引中。在执行搜索时,可以使用 Query DSL 来构建查询语句,并获得与查询条件匹配的文档。 除了基本的搜索功能,Elasticsearch 还提供了许多高级功能,如聚合、分面搜索和地理位置搜索等。通过这些功能,可以更深入地了解数据,并从中提取有用的信息。 总之,Elasticsearch 是一个功能强大的搜索引擎,可以帮助用户处理大量的数据,并从中提取有用的信息。 ### 回答2: Elasticsearch是一个广泛使用的开源分布式搜索和分析引擎。它构建在Apache Lucene搜索引擎库之上,提供了一个简单而强大的RESTful接口,可用于进行实时搜索、数据分析和数据可视化。 Elasticsearch使用非常灵活和易于扩展。它具有以下几个关键特性: 1. 实时搜索:Elasticsearch可以在数据被索引后立即进行搜索,具有非常低的延迟。这使得它在处理实时数据或需要快速响应的应用中非常有用。 2. 分布式架构:Elasticsearch使用分布式架构,数据可以水平分割到多个节点上进行存储和处理。这使得它可以处理大量的数据,并具有高可用性和容错性。 3. 多种查询方式:Elasticsearch支持全文搜索、精确匹配、模糊搜索、聚合操作等多种查询方式。它使用基于DSL的查询语言,使得用户可以通过简单的JSON格式的请求进行复杂的查询操作。 4. 数据分析和可视化:Elasticsearch可以对索引数据进行聚合和分析,并通过与Kibana等工具的集成,实现数据的可视化和监控。 5. 插件生态系统:Elasticsearch拥有丰富的插件生态系统,用户可以根据自己的需求选择合适的插件进行功能扩展。例如,可以通过安装Elasticsearch-Hadoop插件实现与Hadoop集群的数据交互。 总之,Elasticsearch提供了一个快速、可靠的搜索和分析引擎,适用于各种场景,包括网站搜索、日志分析、电商推荐、实时监控等。它具有友好的用户界面和丰富的社区支持,使得使用和学习变得更加容易。 ### 回答3: Elasticsearch是一个开源的实时分布式搜索和分析引擎,它可以用于高效地存储、搜索和分析大规模的数据。以下是关于Elasticsearch的基本使用方法和优势的解释。 首先,为了使用Elasticsearch,我们需要安装它并启动集群。集群由一个或多个节点组成,每个节点都是一个独立的服务器。集群中的所有节点共享索引和数据,并协同工作以提供高可用性和性能。 其次,我们需要创建索引和映射。索引是一种用于存储和组织文档的数据结构,类似于数据库中的表。映射定义了文档中每个字段的数据类型和属性,例如字符串、数字、日期等。创建索引和映射后,我们可以将文档插入索引中。 使用Elasticsearch进行搜索时,我们可以构建复杂的查询来过滤和排序结果。查询可以包括全文搜索、范围查询、模糊匹配等。Elasticsearch使用倒排索引来加快搜索速度,倒排索引记录了每个词汇在哪些文档中出现。 在分析方面,Elasticsearch提供了强大的聚合功能,可以对文档进行统计和分组。聚合可以用于获取文档中的最大值、最小值、平均值等,也可以用于按照某个字段进行分组统计。 此外,Elasticsearch支持实时数据分析。它能够处理大规模的数据并实时更新搜索结果,适用于需要实时反馈和分析的场景,如日志分析、监控和实时报警等。 总的来说,Elasticsearch是一个功能强大的搜索和分析引擎,它以其高性能、可扩展性和易用性而闻名。无论是用于构建实时搜索引擎、日志分析系统还是大数据分析平台,Elasticsearch都是一个非常有价值的工具。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

罐装面包

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值