elasticsearch基本概念

转载 2017年01月03日 14:47:42

http://blog.csdn.net/zhufenglonglove/article/details/51422947

http://blog.csdn.net/stark_summer/article/details/48782953

http://www.jianshu.com/p/492d4311ed04

cluster(集群)

集群包含了一个或者多个拥有相同集群名称的节点。每个集群有一个主节点,这是由集群自动选择出来的,并且在当前主节点挂掉时被其他节点取代。

node(节点)

节点就是一个ES的运行实例,属于一个集群。节点启动时会使用单播(多播)来发现已有的拥有相同名称的集群,并试着加入那个集群。

ES节点调优与脑裂

http://www.cnblogs.com/richaaaard/p/5231748.html

http://blog.csdn.net/wang_zhenwei/article/details/50515459

index(索引)

索引只是一个把一个或多个分片与副本分组在一起的逻辑空间。

索引(index)如同关系数据库中的数据库。索引有一个或多个类型(type)映射。索引是一个逻辑命名空间,该空间可以对应于一个或者多个主shard,并且有零个或多个从shard。

type(类型)

在Elasticsearch中,一个索引对象可以存储很多不同用途的对象。例如,一个博客应用程序可以保存文章和评论。

类型如同关系数据库中的表。每个类型有一个字段的列表,该列表可以被指定为该类型的文档。映射则定义了文档的每个字段将如何被分析。

文档类型让我们轻易地区分单个索引中的不同对象。每个文档可以有不同的结构

shard(分片)

当有大量的文档时,由于内存的限制、硬盘能力、处理能力不足、无法足够快地响应客户端请求等,一个节点可能不够。在这种情况下,数据可以分为较小的称为分片(shard)的部分(其中每个分片都是一个独立的Apache Lucene索引)。每个分片可以放在不同的服务器上,因此,数据可以在集群的节点中传播。

当你查询的索引分布在多个分片上时,Elasticsearch会把查询发送给每个相关的分片,并将结果合并在一起,而应用程序并不知道分片的存在。此外,多个分片可以加快索引。

primary shard、replica shard(主从分片)

为了提高查询吞吐量或实现高可用性,可以使用分片副本。副本(replica)只是一个分片的精确复制,每个分片可以有零个或多个副本。换句话说,Elasticsearch可以有许多相同的分片,其中之一被自动选择去更改索引操作。这种特殊的分片称为主分片(primary shard),其余称为副本分片(replica shard)。在主分片丢失时,例如该分片数据所在服务器不可用,集群将副本提升为新的主分片

ES分片交互过程分析https://my.oschina.net/galenz/blog/422189

mapping(映射)

用于定义索引结构,每个索引都有一个映射,映射定义了索引中每个类型,加上一堆索引范围内的设置。映射可以显式定义,或者会在文档被索引时自动产生

document(文档)

存储在Elasticsearch中的主要实体叫文档(document)。文档类似于关系数据库中的表中的行。每个文档被存放在一个索引下面,拥有类型和ID。被索引的原始JSON文档会被存放在_source字段中。

文档由多个字段组成,相同字段必须有相同类型,每个字段可能多次出现在一个文档里,这样的字段叫多值字段(multivalued)。

从客户端的角度看,文档是一个JSON对象。每个文档存储在一个索引中并有一个Elasticsearch自动生成的唯一标识符和文档类型。文档需要有对应文档类型的唯一标识符,这意味着在一个索引中,两个不同类型的文档可以有相同的唯一标识符。

id(ID)

文档的ID标识了一个文档。文档的index/type/id肯定是唯一的。如果没有ID被提供,那么它会被自动生成

field(字段)

文档由多个字段组成,每个字段有类型,如文本、数值、日期等。字段类型也可以是复杂类型,一个字段包含其他子文档或者数组。字段类型在Elasticsearch中很重要,因为它给出了各种操作(如分析或排序)如何被执行的信息。幸好,这可以自动确定,然而,我们仍然建议使用映射。与关系型数据库不同,文档不需要有固定的结构,每个文档可以有不同的字段,此外,在程序开发期间,不必确定有哪些字段。当然,可以用模式强行规定文档结构。

term(项)

项是在ES中被索引的确切的值。项foo、Foo、FOO不是等价的。项(确切值)可以通过term查询而被搜索到。请查看文本(term)和分析(analysis)。

text(文本)

文本(或者全文)是一般的非结构化文本。文本默认地会被分析成项(term),项是直接存放在索引中的。文本的字段需要在索引时被分析,从而可以作为全文可搜索的,而在全文查询中的关键词(keyword)必须在搜索时进行分析来产生(和检索)在索引时生成的同样的项(term)。

Elasticsearch 关键字:索引,类型,字段,索引状态,mapping,文档,白话文说

1. 索引 索引(index)是Elasticsearch对逻辑数据的逻辑存储,所以它可以分为更小的部分。你可以把索引看成关系型数据库的表。然而,索引的结构是为快速有效的全文索引准备的,特别是它不存储...
  • qq_27093465
  • qq_27093465
  • 2016年12月09日 21:35
  • 2361

Elasticsearch入门教程之一--基本概念

Elasticsearch入门教程之一–基本概念 概述 索引 检索 文档 文档类型 分片 副本 概述Elasticsearch基于Lucene(搜索引擎库)的开源搜索引擎,对外提供一系列基于Java和...
  • zhufenglonglove
  • zhufenglonglove
  • 2016年05月16日 10:16
  • 1943

【Elasticsearch】基础知识

Elasticsearch有几个核心概念。从一开始理解这些概念会对整个学习过程有莫大的帮助。接近实时(NRT)Elasticsearch是一个接近实时的搜索平台。这意味着,从索引一个文档直到这个文档能...
  • u011404265
  • u011404265
  • 2016年05月05日 11:30
  • 3898

Elasticsearch基本概念

Apache Lucene 相似度评分lucence相似度评分公式: es除了使用上面的默认公式外,还允许用户自定义评分规则。查询重写(query rewrite)es会对模糊查询(前缀匹配、通配符...
  • zkq_1986
  • zkq_1986
  • 2016年07月22日 15:28
  • 136

ElasticSearch的安装部署及基本概念

1、简介 ElasticSearch(简称ES)是一个分布式、Restful的搜索及分析服务器,设计用于分布式计算;能够达到实时搜索,稳定,可靠,快速。它是基于Lucence的索引服务器,Elas...
  • eff666
  • eff666
  • 2016年10月18日 08:53
  • 234

elasticsearch的基本概念

elasticsearch的基本概念: 8.1索引:          在Elasticsearch中,索引是具备某些共同特征的文档集。          每一个索引包含多个类型,每个类型相应的...
  • shunzi1046
  • shunzi1046
  • 2016年12月08日 15:06
  • 138

ElasticSearch5.0 基本概念和配置

一、说明几个重要的配置文件 #/etc/sysconfig/elasticsearch 配置elasticsearch环境变量 #/etc/elasticsearch/elasti...
  • smilepasta035
  • smilepasta035
  • 2017年06月26日 18:07
  • 500

ElasticSearch基本概念介绍(一)

1、概述 Elasticsearch是面向文档(document oriented)的,这意味着它可以存储整个对象或文档(document)。然而它不仅仅是存储,还会索引(index)每个文档的内容...
  • eff666
  • eff666
  • 2016年09月05日 20:06
  • 740

ElasticSearch5.2.2 基本概念和集群配置详解

一、说明几个重要的配置文件 #/etc/sysconfig/elasticsearch 配置elasticsearch环境变量 #/etc/elasticsearch/elasti...
  • WuLex
  • WuLex
  • 2017年05月05日 11:55
  • 1617

elasticsearch 开始 —— 基本概念

basic concepts
  • gniMiL
  • gniMiL
  • 2014年06月07日 14:38
  • 607
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:elasticsearch基本概念
举报原因:
原因补充:

(最多只允许输入30个字)