ElasticSearch教程——创建索引、类型、文档

ElasticSearch汇总请查看:ElasticSearch教程——汇总篇

介绍

  • 索引是ElasticSearch存放数据的地方,可以理解为关系型数据库中的一个数据库。事实上,我们的数据被存储和索引在分片(shards)中,索引只是一个把一个或多个分片分组在一起的逻辑空间。然而,这只是一些内部细节——我们的程序完全不用关心分片。对于我们的程序而言,文档存储在索引(index)中。剩下的细节由Elasticsearch关心既可。(索引的名字必须是全部小写,不能以下划线开头,不能包含逗号)
  • 类型用于区分同一个索引下不同的数据类型,相当于关系型数据库中的表。在Elasticsearch中,我们使用相同类型(type)的文档表示相同的“事物”,因为他们的数据结构也是相同的。每个类型(type)都有自己的映射(mapping)或者结构定义,就像传统数据库表中的列一样。所有类型下的文档被存储在同一个索引下,但是类型的映射(mapping)会告诉Elasticsearch不同的文档如何被索引。
  • 文档是ElasticSearch中存储的实体,类比关系型数据库,每个文档相当于数据库表中的一行数据。 在Elasticsearch中,文档(document)这个术语有着特殊含义。它特指最顶层结构或者根对象(root object)序列化成的JSON数据(以唯一ID标识并存储于Elasticsearch中)。
  • 文档由字段组成,相当于关系数据库中列的属性,不同的是ES的不同文档可以具有不同的字段集合。 
    对比关系型数据库:
 
  1. Relational DB -> Databases -> Tables -> Rows -> Columns

  2. Elasticsearch -> Indices -> Types -> Documents -> Fields

文档元数据

一个文档不只有数据。它还包含了元数据(metadata)——关于文档的信息。三个必须的元数据节点是:

节点说明
_index文档存储的地方
_type文档代表的对象的类
_id文档的唯一标识

_index:索引

_type:类型

_id:id仅仅是一个字符串,它与_index_type组合时,就可以在Elasticsearch中唯一标识一个文档。当创建一个文档,你可以自定义_id,也可以让Elasticsearch帮你自动生成。

 

索引创建原则

  1. 类似的数据放在一个索引,非类似的数据放不同索引:product index(包含了所有的商品),sales index(包含了所有的商品销售数据),inventory index(包含了所有库存相关的数据)。如果你把比如product,sales,human resource(employee),全都放在一个大的index里面,比如说company index,不合适的。
  2. index中包含了很多类似的document:类似是什么意思,其实指的就是说,这些document的fields很大一部分是相同的,你说你放了3个document,每个document的fields都完全不一样,这就不是类似了,就不太适合放到一个index里面去了。
  3. 索引名称必须是小写的,不能用下划线开头,不能包含逗号:product,website,blog

 

 

创建索引、类型、文档(接口的方式)

以kibana的方式操作ES的可以查看ElasticSearch教程——Kibana简单操作ES

以博客内容管理为例,索引名为blog,类型为article,自定义id是“1”,新加一个文档:

 
  1. curl -H 'Content-Type:application/json' -XPUT http://localhost:9200/blog/article/1 -d '

  2. {

  3. "id": "1",

  4. "title": "New version of Elasticsearch released!",

  5. "content": "Version 1.0 released today!",

  6. "priority": 10,

  7. "tags": ["announce", "elasticsearch", "release"]

  8. }'

 

自增ID

当我们想要一个自增ID的时候,直接不用设置id即可,即原来是把文档存储到某个ID对应的空间,现在是把这个文档添加到某个_type下(注意:这边是POST不是PUT)

 
  1. curl -H 'Content-Type:application/json' -XPOST http://localhost:9200/blog/article/ -d '

  2. {

  3. "title": "New version of Elasticsearch released!",

  4. "content": "Version 1.0 released today!",

  5. "priority": 10,

  6. "tags": ["announce", "elasticsearch", "release"]

  7. }'

返回结果:

 
  1. {

  2. "_index": "blog",

  3. "_type": "article",

  4. "_id": "eTmX5mUBtZGWutGW0TNs",

  5. "_version": 1,

  6. "result": "created",

  7. "_shards": {

  8. "total": 2,

  9. "successful": 1,

  10. "failed": 0

  11. },

  12. "_seq_no": 0,

  13. "_primary_term": 1

  14. }

 

自动生成的id,长度为20个字符,URL安全,base64编码,GUID,分布式系统并行生成时不可能会发生冲突。

 

检索文档

在对应的浏览器地址栏输入如下地址

http://XXX.XXX.XXX.XX:9200/blog/article/1?pretty

或者在Linux中使用如下脚本:

curl -H 'Content-Type:application/json' -XGET http://localhost:9200/blog/article/1?pretty

 

响应包含了现在熟悉的元数据节点,增加了_source字段,它包含了在创建索引时我们发送给Elasticsearch的原始文档。

pretty在任意的查询字符串中增加pretty参数,类似于上面的例子。会让Elasticsearch美化输出(pretty-print)JSON响应以便更加容易阅读。

 

_source字段不会被美化,它的样子与我们输入的一致,现在只包含我们请求的字段,而且过滤了date字段。

或者你只想得到_source字段而不要其他的元数据,你可以这样请求:

curl -H 'Content-Type:application/json' -XGET http://localhost:9200/blog/article/1/_source

返回结果:

 
  1. {

  2. "id": "1",

  3. "title": "New version of Elasticsearch released!",

  4. "content": "Version 1.0 released today!",

  5. "priority": 10,

  6. "tags": ["announce", "elasticsearch", "release"]

  7. }

 

 

 

请求返回的响应内容包括{"found": true}。这意味着文档已经找到。如果我们请求一个不存在的文档,依旧会得到一个JSON,不过found值变成了false。此外,HTTP响应状态码也会变成'404 Not Found'代替'200 OK'。我们可以在curl后加-i参数得到响应头:

curl -H 'Content-Type:application/json' -i -XGET http://localhost:9200/blog/article/1?pretty

显示结果:

 
  1. HTTP/1.1 200 OK

  2. content-type: application/json; charset=UTF-8

  3. content-length: 337

  4.  
  5. {

  6. "_index" : "blog",

  7. "_type" : "article",

  8. "_id" : "1",

  9. "_version" : 1,

  10. "found" : true,

  11. "_source" : {

  12. "id" : "1",

  13. "title" : "New version of Elasticsearch released!",

  14. "content" : "Version 1.0 released today!",

  15. "priority" : 10,

  16. "tags" : [

  17. "announce",

  18. "elasticsearch",

  19. "release"

  20. ]

  21. }

  22. }

 

 

更新文档

 
  1. curl -H 'Content-Type:application/json' -XPOST http://localhost:9200/blog/article/1/_update -d '{

  2. "script": "ctx._source.content = \"new content\""

  3. }'

删除文档

curl -XDELETE http://localhost:9200/blog/article/1 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值