Elasticsearch 简介

最新推荐文章于 2022-06-22 08:00:00 发布

wuxiao5570

最新推荐文章于 2022-06-22 08:00:00 发布

阅读量428

点赞数

分类专栏：运维 Elasticsearch 文章标签： elasticsearch nosql

本文链接：https://blog.csdn.net/wuxiao5570/article/details/54425584

版权

运维同时被 2 个专栏收录

16 篇文章 1 订阅

订阅专栏

Elasticsearch

14 篇文章 1 订阅

订阅专栏

Java API
节点客户端(node client)
传输客户端(Transport client)
都通过9300端口与集群交互,集群中的节点之间也通过9300端口进行通信.

RESTful API HTTP
通过9200端口的与Elasticsearch进行通信,?pretty参数将使请求返回更加美观易读的JSON数据。
curl -i -XGET '172.28.80.11:9200/' 加-i参数，显示header头信息。

对比图来类比传统关系型数据库：
Relational DB -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Indices   -> Types -> Documents -> Fields

搜索匹配：
GET /megacorp（索引）/employee（类型）/_search（文档原始数据）?q=last_name:Smith

DSL查询(Query DSL)
match:
GET /megacorp/employee/_search
{
    "query" : {
        "match" : {
            "last_name" : "Smith"
        }
    }
}
filter:
GET /megacorp/employee/_search
{
    "query" : {
        "filtered" : {
            "filter" : {
                "range" : {
                    "age" : { "gt" : 30 } <1>
                }
            },
            "query" : {
                "match" : {
                    "last_name" : "smith" <2>
                }
            }
        }
    }
}

全文检索：
所谓的「结果相关性评分」就是文档与查询条件的匹配程度。
GET /megacorp/employee/_search
{
    "query" : {
        "match" : {
            "about" : "rock climbing"
        }
    }
}

match匹配 match_phrase短语匹配 highlight高亮匹配

GET /megacorp/employee/_search
{
    "query" : {
        "match_phrase" : {
            "about" : "rock climbing"
        }
    },
    "highlight": {
        "fields" : {
            "about" : {}
        }
    }
}

聚合(aggregations)，类似SQL中的GROUP BY
GET /megacorp/employee/_search
{
    "aggs" : {
        "all_interests" : {
            "terms" : { "field" : "interests" },
            "aggs" : {
                "avg_age" : {
                    "avg" : { "field" : "age" }
                }
            }
        }
    }
}
结果：
"all_interests": {
     "buckets": [
        {
           "key": "music",
           "doc_count": 2,
           "avg_age": {
              "value": 28.5
           }
        },
        {
           "key": "forestry",
           "doc_count": 1,
           "avg_age": {
              "value": 35
           }
        },
        {
           "key": "sports",
           "doc_count": 1,
           "avg_age": {
              "value": 25
           }
        }
     ]
}

集群健康(cluster health)。集群健康有三种状态：green、yellow或red。

green    所有主要分片和复制分片都可用
yellow    所有主要分片可用，但不是所有复制分片都可用
red    不是所有的主要分片都可用

GET /_cluster/health
{
"cluster_name": "es-cluster",
"status": "green",
"timed_out": false,
"number_of_nodes": 2,
"number_of_data_nodes": 2,
"active_primary_shards": 6,
"active_shards": 12,
"relocating_shards": 0,
"initializing_shards": 0,
"unassigned_shards": 0,
"delayed_unassigned_shards": 0,
"number_of_pending_tasks": 0,
"number_of_in_flight_fetch": 0,
"task_max_waiting_in_queue_millis": 0,
"active_shards_percent_as_number": 100
}

分片(shard)

一个分片(shard)是一个最小级别“工作单元(worker unit)”,它只是保存了索引中所有数据的一部分。分片就是一个Lucene实例，并且它本身就是一个完整的搜索引擎。
文档存储在分片中，并且在分片中被索引，但是我们的应用程序不会直接与它们通信，取而代之的是，直接与索引通信。

分片是Elasticsearch在集群中分发数据的关键。把分片想象成数据的容器。文档存储在分片中，然后分片分配到你集群中的节点上。当你的集群扩容或缩小，Elasticsearch将会自动在你的节点间

迁移分片，以使集群保持平衡。

【原创】原创文章，更多关注敬请关注微信公众号。