Elasticsearch———基础教程
文章平均质量分 85
qq_36657751
这个作者很懒,什么都没留下…
展开
-
Elasticsearch(自定义分析器)
自定义分析器 虽然Elasticsearch内置了一系列的分析器,但是真正的强大之处在于定制你自己的分析器。你可以通过在配置文件中组合字符过滤器,分词器和表征过滤器,来满足特定数据的需求。 分析器 是三个顺序执行的组件的结合(字符过滤器,分词器,表征过滤器)。 字符过滤器 字符过滤器是让字符串在被分词前变得更加“整洁”。例如,如果我们的文 本是HTML格式,它可能会原创 2017-11-28 16:13:42 · 26028 阅读 · 0 评论 -
Elasticsearch(映射)
映射 索引中每个文档都有一个类型(type)。每个类型拥有自己的映射(mapping)或者模式定义(schema definition)。一个映射定义了字段类型,每个字段的数据类型,以及字段被Elasticsearch处理的方式。映射还用于设置关联到类型上的元数据。 核心简单字段类型 Elasticsearch支持以下简单字段类型: 当你索引一个包含新字段的文档--一个之前没有原创 2017-11-28 09:44:48 · 23701 阅读 · 0 评论 -
Elasticsearch(分析和分析器)
分析和分析器 分析(analysis)是这样一个过程: *首先,表征化一个文本块适用于倒排索引单独的词(term) *然后标准化这些词为标准形式,提高它们的“可搜索性”和“查全率” 这个工作是分析器(analyzer)完成的。一个分析器(analyzer)只是一个包装用于将三个功能放到一个包里: 字符过滤器: 首先字符串经过字符过滤器(character fil原创 2017-11-28 08:42:02 · 23568 阅读 · 0 评论 -
Elasticsearch(搜索(2)--基本的工具)
确切值(Exact values)vs全文文本(Full text) Elasticsearch中的数据可以大致分为两种类型: 确切值及全文文本。 确切值是确定的,正如它的名字一样。比如一个date或用户ID,也可以包含更多的字符串比如username或email地址。 确切值“foo”和“foo”就并不相同。确切值2014和2014-09-15也不相同。 全文文本,从另一个角度来说是文原创 2017-11-27 16:18:34 · 23447 阅读 · 0 评论 -
Elasticsearch(搜索(1)--基本的工具)
空搜索 最基本的搜索API表单是空搜索(empty search),它没有指定任何的查询条件,只返回集群中的索引文档: 请求命令: url http://10.139.32.155:9200/_search 响应内容类似于这样: {"took":18,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hi原创 2017-11-27 14:50:23 · 23356 阅读 · 0 评论 -
Elasticsearch(新建索引和文档)
新建索引和文档 新建索引和删除请求都是写操作,它们必须在主分片上成功完成才能复制到相关的复制分片上。 主分片和复制分片上成功创建索引和删除一个文档必要的顺序步骤: 1、客户端给node1发送新建索引和删除请求。 2、节点使用文档的_id确定文档属于分片0.它转发请求到node3,分片0位于这 个节点上。 3、node3在主分片上执行请求,如果成功,它转发请求到相应的位原创 2017-11-23 08:38:06 · 22473 阅读 · 0 评论 -
Elasticsearch(文档局部更新)
文档局部更新 文档是不可变的---它们不能被更改,只能被替换。update API必须遵循相同的规则。表面看来,我们似乎是局部更新了文档的位置,内部却是像我们之前说的一样简单的使用update API处理相同的检索-修改-重建索引流程,我们也减少了其他进程可能导致冲突的修改。 最简单的update请求表单接收一个局部文档参数doc,它会合并到现有文档中---对象合并在一起,存在的标量字段被原创 2017-11-22 17:12:09 · 24595 阅读 · 0 评论 -
Elasticsearch(处理冲突)
处理冲突 当使用index API更新文档的时候,我们读取原始文档,做修改,然后将整个文档(whole document)一次性的重新索引。最近的索引请求会生效-Elasticsearch中只存储最后被索引的任何文档。如果其他人同时也修改了这个文档,他们的修改,将会丢失。 例子: 一天,老板决定做一个促销。瞬间,我们每秒就销售了几个商品。想象两个同时运行的web进程,两者同时处理一件商品原创 2017-11-22 10:26:44 · 20422 阅读 · 0 评论 -
pyes对elasticsearch的数据基本查询
#!/usr/bin/env python # -*- coding: utf-8 -*- """ Created on 2017-11-20 @author: Negen """ import pyes #创建ES连接,这是我的ip地址,个人本机上就用localhost,默认端口9200 conn = pyes.ES(['10.139.32.155:9200']) ''' 查询语句原创 2017-11-21 10:25:42 · 20943 阅读 · 0 评论 -
初识pyes(实现elasticsearch数据的插入)
名词解释: boost: boost参数被用来增加一个子句的相对权重(当boost大于1时),或者减小相对权重(当boost介于0到1时),但是增加或者减小不是线性的。换言之,boost设为2并不会让最终的_score加倍。 相反,新的_score会在适用了boost后被归一化(Normalized)。每种查询都有自己的归一化算法(Normalization Algorithm)。但是能够说原创 2017-11-21 08:35:53 · 21442 阅读 · 0 评论