Elasticsearch 技术分享

最新推荐文章于 2023-02-02 12:08:21 发布

VIP文章 chao_dev

最新推荐文章于 2023-02-02 12:08:21 发布

阅读量647

点赞数

文章标签：大数据 elasticsearch

本文链接：https://blog.csdn.net/chao_dev/article/details/117780558

版权

Elasticsearch 技术分享

文章目录

- Elasticsearch 技术分享

一，Elasticsearch 基础介绍

1.简介

Elasticsearch是一个高度可扩展的、开源的、基于 Lucene 的全文搜索和分析引擎。它允许您快速，近实时地存储，搜索和分析大量数据

Elasticsearch其实它是通过简单的 RESTful API 来隐藏 Lucene 的复杂性，从而让全文搜索变得简单。

除了Lucene 和全文搜索，还有以下功能

分布式的实时文件存储，每个字段都被索引并可被搜索
分布式的实时分析搜索引擎
可以扩展到上百台服务器，处理PB级结构化或非结构化数据

而且，所有的这些功能被集成到一个服务里面，你的应用可以通过简单的RESTful API、各种语言的客户端甚至命令行与之交互。

2.kibana

Kibana是一个开源分析和可视化平台，旨在与Elasticsearch协同工作。可以用Kibana搜索，查看和与存储在 Elasticsearch 索引中的数据进行交互。您可以轻松地执行高级数据分析，并在各种图表，表格和地图中可视化您的数据。

注意：在开发中jar的版本和ELK（ElasticSearch, logstash, kibana）技术栈的版本统一

3.基本概念

索引（Index）
索引是具有某些类似特征的文档集合。例如，您可以拥有店铺数据的索引，商品的一个索引以及订单数据的一个索引。
类型（Type）6.0.0版本中弃用
类型，曾经是索引的逻辑类别/分区，允许您在同一索引中存储不同类型的文档，例如，一种类型用于用户，另一种类型用于博客帖子。
文档（Document）
文档是可以建立索引的基本信息单元。例如，您可以为单个客户提供文档，为单个产品提供一个文档，为单个订单提供一个文档。该文档以JSON表示
分片(Shards)
索引可能存储大量可能超过单个节点的硬件限制的数据。例如，占用1TB磁盘空间的十亿个文档的单个索引可能不适合单个节点的磁盘，或者可能太慢而无法单独从单个节点提供搜索请求。它允许您跨分片（可能在多个节点上）分布和并行化操作，从而提高性能/吞吐量
副本(Replicasedit)
副本，是对分片的复制。目的是为了当分片/节点发生故障时提供高可用性，它允许您扩展搜索量/吞吐量，因为可以在所有副本上并行执行搜索。

注意：副本是乘法，越多越浪费，但也越保险。分片是除法，分片越多，单分片数据就越少也越分散。

可以画一个对比图来类比传统关系型数据库：

关系型数据库 -> Databases(库) -> Tables(表) -> Rows(行) -> Columns(列)。
Elasticsearch -> Indeces(索引) -> Types(类型) -> Documents(文档) -> Fields(属性)。

4.索引的应用

创建索引

PUT project_v1
{
   
  "settings": {
   
    "number_of_shards": 1,
    "number_of_replicas": 1
  },
  "mappings": {
   
    "properties": {
   
      "name_cn": {
   
        "type": "text"
      },
      "name_en": {
   
        "type": "keyword"
      },
      "project_type": {
   
        "type": "keyword"
      },
      "people_count": {
   
        "type": "integer"
      },
      "order_count": {
   
        "type": "long"
      },
      "date": {
   
        "type": "date",
        "format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||yyyy-MM||epoch_millis"
      }
    }
  }
}

text 用于索引全文值的字段，例如电子邮件正文或产品说明。它们通过分词器传递，以在被索引之前将字符串转换为单个术语的列表。分析过程允许Elasticsearch搜索单个单词中每个完整的文本字段。文本字段不用于排序，很少用于聚合。
keyword 用于索引结构化内容的字段，例如电子邮件地址，主机名，状态代码，邮政编码或标签。它们通常用于过滤，排序，和聚合。keyword字段只能按其确切值进行搜索。
有时候一个字段同时拥有全文类型（text）和关键字类型（keyword）是有用的：一个用于全文搜索，另一个用于聚合和排序。

新增索引数据

PUT /project_v1/_doc/1
{
   
  "name_en":"encourage",
  "name_cn":"营销码",
  "project_type":"营销",
  "people_count":4,
  "order_count":1000000,
  "date":

最低0.47元/天解锁文章

chao_dev

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Elasticsearch 技术分享

Elasticsearch 技术分享文章目录Elasticsearch 技术分享一，Elasticsearch 基础介绍1.简介2.kibana3.基本概念4.索引的应用二，Elasticsearch 聚合查询1.聚合的概念2.Metric(指标)聚合3.Bucket(桶)聚合4.Pipeline(管道)聚合5.Matrix(矩阵)聚合6.总结三，Elasticsearch 索引别名Aliases1.业务问题2.别名定义3.别名管理4.Filtered Aliases5.Write Index Alias
复制链接

扫一扫