Elasticsearch服务器开发第二版读书笔记

原创 2017年01月02日 22:30:33

首先很想说,很高兴有位同济的大学研究生同学,让我可以在毕业5个月后,还能再次走进图书馆去借自己想看的书籍,比如最近因为工作需要而接触的elasticsearch。

传入的文档中的数据怎么转化为倒排索引,查询文本怎样变成可搜索的词---->这个数据转化的过程就是分析.

由于其分布性性质和实时功能,许多人把他称为文档数据库。


Elaseticsearch把数据存在一个或多个索引上,每个索引包含各种类型的文档,我们也知道每个文档有很多字段映射定义了Elasticsearch如何对待这些字段


分片:当有大量的文档时,由于内存的限制,硬盘能力,处理能力不足,无法足够响应客户端请求等,一个节点可能不够,在这中情况下,数据可以分为较小的分片(shard)的部分,(其中每个分片都是一个独立的Apache Lucence)。每个分片可以放在不同的服务器上,因此,数据可以在集群中的节点中传播。查询时会把结果合并在一起显示。


Elasticsearch使用文档的唯一标识符来计算文档应该被放到哪个分片中,索引请求到一个节点后,该节点会转发文档到持有相关分片的目标节点中。尝试用文档标识符来获取文档时,发送查询到一个节点。。。


elasticsearch索引是由一个或多个分片组成的,每个分片包含了文档集的一部分。而这些分片也可以有副本,他们是分片的完整副本。在创建索引的过程中,可以规定应创建分片的分片及副本的数量。默认配置是5个分片和一个副本。这也意味着操作结束时,将有10个lucence索引分布在集群中。------每个分片都有自己的分片副本。


字段类型及其公共属性参考:https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-standard-analyzer.html

                                               http://www.cnblogs.com/xing901022/p/5471419.html



Elasticsearch索引的每个文档都有自己的标识符和类型,在ES中,文档存在两种内部标识符。

  • _uid:是索引中文档的唯一标识符,由文档的标识符和类型构成,此字段不需要设置,总是被索引。
  • _id:实际标识符,一般创建文档是时候会传入,如果不传入会自动生成一个。
在es中,映射在文件中以json对象传送,

curl命令时参数设置情况:
curl -XPUT http://localhost:9200/{index}/{type}/_mapping -data-binnary @document.json

这里用--data-binary,没有用-d,因为-d 参数忽略换行符,而换行符在es的批量请求中很重要,也就是说此参数可以保留换行符。





版权声明:本文为博主原创文章,未经博主允许不得转载。

使用PostGIS进行轨迹分析

从 sqlite 数据库中读取轨迹数据,存储到 postgis 数据库中,再利用 postgis 的特性进行轨迹分析。...
  • doris_d
  • doris_d
  • 2015年05月19日 16:30
  • 1264

jdk和ant环境变量配置

windows下配置JDK环境变量:       1.安装JDK,安装过程中可以自定义安装目录等信息,例如我们选择安装目录为D:/java/jdk1.5.0_08;   2.安装完成后,右击“...
  • Peisl
  • Peisl
  • 2011年11月21日 09:35
  • 6906

汇编语言-第二版 读书笔记.doc

  • 2012年08月07日 22:00
  • 599KB
  • 下载

lua开发(9)--<Lua程序设计第二版>读书笔记

本篇是读书笔记,对于平时没有用到或者很少用到的Lua相关语法的地方做下记忆...

代码大全第二版读书笔记 第五部分-代码改善 二十二、开发者测试

开发者测试p499 开发者测试在软件质量中的角色P500 开发者测试的推荐方法P503 测试技巧锦囊p505 典型错误 测试支持工具 改善测试过程 保留测试数据 开发者测试(p499)软件测试一般分为...

《Groovy程序设计》读书笔记之第二部分 面向Java开发者的Groovy(上)

本文是《Groovy程序设计》一书的读书整理笔记系列文章 Hello Groovy & Groovy循环 & 异常处理 & 安全导航操作符下面是一个java文件实现,与groovy实现的对比,...

《Groovy程序设计》读书笔记之第二部分 面向Java开发者的Groovy(下)

本文是《Groovy程序设计》一书的读书整理笔记系列文章 这篇文章是继 http://www.jianshu.com/p/572407860ecf 的下篇,如果没有看上篇文章的话,建议先看看上...

[UNIX环境高级编程第二版]读书笔记6章

6.1  由于历史原因,大量系统有关的数据文件都是ASCII文本文件。 6.2  口令文件中shell如果为/dev/null表示阻止任何人以该用户名义登陆。      finger -p use...

代码大全第二版读书笔记 第四部分-语句 十四、组织直线型代码 十五、使用条件语句

组织直线型代码(P347) 1.必须有明确顺序的语句(P347) 如果语句之间存在依赖关系,并且这些关系要求你把语句按照一定的顺序加以排列,那么请设法使得这些依赖关系变得明显。 设法...

高性能MySQL(第二版)第三章 架构优化和索引(上)——读书笔记

一,选择优化的数据类型      更小通常更好      更小的数据类型使用了更少的磁盘,内存和CPU缓存      但是要确保不要低估需要保存的值,在架构中的多个地方增加数据类型的范围是一件极其费时...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Elasticsearch服务器开发第二版读书笔记
举报原因:
原因补充:

(最多只允许输入30个字)