elasticsearch的简单使用介绍以及基本的操作

elasticsearch

1.number_of_shards:分片数量,类似于数据库里面分库分表,一经定义不可更改。主要响应写操作
2.number_of_replicas:副本数,用于备份分片的,和分片里面的数据保持一致,主要响应读操作,副本越多读取就越快。
3.分布式索引一定要注意分片数量不能更改,所以在创建的时候一定要预先估算好数据大小,一般在8CPU16G的机器上一个分片不要超过300g。索引会根据分片的配置来均匀的响应用户请求
4.如果调整了分片数那就要重建索引。

创建一个索引
PUT /test
{
   "settings" : {
      "number_of_shards" : 1, //分片
      "number_of_replicas" : 1  //分片副本
 }
更新其replicas状态,但是不能更新shards状态
PUT /test/_settings
{
      "number_of_replicas" : 0
}
创建索引,指定id建立索引
PUT /test/_doc/1
{
    "name": "今生", 
    "age": 30
}
指定id全量修改索引
PUT /test/_doc/1
{
    "name": "今生2"
}
指定id部分字段修改
POST /test/_doc/1/_update
{
  "doc":{
    "name":"今生2"
  }
}
指定_create防止重复创建,如果已经存在则失败,以下语句执行第二次会报错
POST /test/_doc/2/_create
{
  "name":"今生",
  "age":1
}

使用搜索全部
GET /test/_search
获取指定id
GET /test/_doc/1
不指定id建立索引,es会默认给你生成一个
POST /test/_doc/
{
    "name": "今生two", 
    "age": 30
}
删除文档:指定id
delete /test/_doc/1
删除索引
DELETE /test
结构化创建索引
PUT /test
{
  "settings": {
    "number_of_shards": 1,
    "number_of_replicas": 1
  },
  "mappings": {
  "_doc":{
         "properties": {
           "name":{"type": "text","analyzer":"ik_max_word","search_analyzer": "ik_smart"},
           "sname":{"type": "text","analyzer":"ik_smart"},
           "enname":{"type":"text","analyzer":"english"},
           "age":{"type": "integer"}
         }
    }
  }
}

Es基础类型:

Text:字符串类型,可以被分析;
Keyword:不能被分析,只可以精确匹配的字符串类型
Date:日期类型,通常配合format使用 比如{“type”:”date”,”format”:”yyyy-MM-dd”}
Long,integer,short…
Boolean
Array:数组类型
Object:一般是json
Ip:ip地址
geo_point:地理位置 {
“lat”:
“lon”:
}

Es查询:

(1)主键查询:

GET /test/_doc/1

(2)查询all

GET /test/_search
{
  "query":{
    "match_all": {}
  }
}

(3)分页查询:

GET /test/_search
{
  "query":{
    "match_all": {}
  },
  "from":0,
  "size":1
}

(4)带条件查询:

GET /test/_search
{
  "query":{
    "match": {"name":"今生"}
  }
}

(5)带排序:

GET /test/_search
{
  "query":{
    "match": {"name":"今生"}
  },
  "sort":[
  	{"age":{"order":"desc"}}
  ]
}

(6)聚合查询:

GET /test/_search
{
  "query":{
    "match": {"name":"今生"}
  },
  "sort":[
  	{"age":{"order":"desc"}}
  ],
  "aggs":{
  	"group_by_age":{
  		"terms":{
  			"field":"age"
  		}
  	}
  }
}

分析器

一般常用的有三种;默认的stander,English,IK
Ik分词在建立的时候要注意:建索引采用ik_max_word 检索采用ik_smart

GET /test/_analyze
{
  "field": "name",
  "text": "my name is jinsheng and i like eating apples and running"
}
GET /test/_analyze
{
  "field": "sname",
  "text": "深圳市软件园一期"
}

es 进阶查询

Match查询

Match时最为简单的一种查询了,它会完全按照我们定义的字段analyzer进行索引内查询。
比如Ik分词的 在查询的时候也会进行分词。里面还可以指定我们想要的查询方式 比如 or 或者 and

GET /book/_search
{
  "query": {
    "match": {
      "bookName": "童话故事大全"
    }
  }
}
对分词进行or 或者 and查询
GET /book/_search
{
  "query": {
    "match": {
      "bookName": {
        "query": "大自然的声音",
        "operator": "and"
      }
    }
  }
}

Term查询:

对查询的字段不进行分词的精准查询,除非满足关键词或者倒排索引的分词,否则查询不到

GET /book/_search
{
  "query": {
    "term": {
      "bookName": {
        "value": "童话故事大全"
      }
    }
  }
}

匹配度查询:

在检索的时候有一个最小匹配查询

GET /book/_search
{
  "query": {
    "match": {
      "bookName": {
        "query": "安徒生的大自然童话故事",
        "operator": "or",
        "minimum_should_match": 2
      }
    }
  }
}

多字段查询

GET /book/_search
{
  "query": {
    "multi_match": {
      "query": "大自然的旅行故事",
      "fields": ["bookName","discription"]
    }
  }
}
多字段添加权重
GET /book/_search
{
  "explain": true, 
  "query": {
    "multi_match": {
      "query": "大自然的旅行故事",
      "fields": ["bookName^10","discription"]
    }
  }
}
平滑一下 更加突出权重:
GET /book/_search
{
  "explain": true, 
  "query": {
    "multi_match": {
      "query": "大自然的旅行故事",
      "fields": ["bookName^10","discription"],
      "tie_breaker": 0.3 // max plus 0.3 times others of,最大值加上其他值的0.3倍
    }
  }
}
取最好的字段:
GET /book/_search
{
  "explain": true, 
  "query": {
    "multi_match": {
      "query": "大自然的旅行故事",
      "fields": ["bookName","discription"],
      "type": "best_fields"
    }
  }
}
多字段分值相加
GET /book/_search
{
  "explain": true, 
  "query": {
    "multi_match": {
      "query": "大自然的旅行故事",
      "fields": ["bookName","discription"],
      "type": "most_fields"
    }
  }
}
以分词为单位分别在每个字段里面得分取最大的相加,非常适用于以词作为权重的系统
GET /book/_search
{
  "explain": true, 
  "query": {
    "multi_match": {
      "query": "大自然的旅行故事",
      "fields": ["bookName","discription"],
      "type": "cross_fields"
    }
  }
}
queryString:
GET /book/_search
{
  "query": {
    "query_string": {
      "fields": ["bookName"],
      "query": "大自然 AND 旅行"
    }
  }
}

queryString:
简单查询中经常使用,可以配合 AND OR NOT 使用

Bool查询

Must:所有的条件都是ture
Must not:所有的条件都是false
Should:在其条件中只要有一个为ture即可,但是true越多的排在越前面

GET /book/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "bookName": "安徒生"
          }
        },
        {
          "match": {
            "discription": "丑小鸭"
          }
        }
      ]
    }
  }
}

9.过滤查询
filter:
filter如何进行排序?
(1)自行使用sort字段
(2)联合其他的查询一起使用

GET /book/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "range": {
            "commentNum": {
              "lte": 2000,
              "gte": 1
            }
          }
        },
        {
          "term": {
            "author":"朱奎"
          }
        }
      ]
    }
  } ,
  "sort": [
    {
      "commentNum": {
        "order": "desc"
      }
    }
  ]
}

Function score.

Score字段:

带打分的match
GET /book/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "bookName": "先生"
          }
        }
      ], 
      "filter": [
        {
          "range": {
            "commentNum": {
              "lte": 2000,
              "gte": 1
            }
          }
        },
        {
          "term": {
            "author":"王德启,王晶/著"
          }
        }
      ]
    }
  }
}

GET /book/_search
{
  "query": {
    "function_score": {
      "query": {
        "multi_match": {
          "query": "大自然的旅行故事",
          "fields": ["bookName","discription"],
          "operator": "or",
          "type": "most_fields"
        }
      },
      "functions": [
        {
          "field_value_factor": {
            "field": "commentNum",
            "modifier": "log2p",
            "factor": 8
          }
        }
      ],
      
      "score_mode": "sum",
      "boost_mode": "sum"
    }
  }
}

同义词

在我们的搜索引擎中往往会出现以下这样的情况 比如:我搜苹果
这时候是不是既要出苹果也要出Iphone呢?
是的,那么这种情况怎么处理呢?同义词就派上用场啦。
(1)在Es服务器上新加同义词文件
synonyms.txt

苹果,iphone,apple
美丽,漂亮,气质好

(2)在构建索引的时候设置同义词type
(3)指定mapping的分析器为同义词

PUT /test11
{
  "settings": {
    "number_of_replicas": 1,
    "number_of_shards": 1,
    "analysis": {
      "filter": {
        "my_synonym_filter": {
          "type": "synonym",
          "synonyms_path": "analysis-ik/synonyms.txt"
        }
      },
      "analyzer": {
        "ik_syno": {
          "type": "custom",
          "tokenizer": "ik_smart",
          "filter": [
            "my_synonym_filter"
          ]
        },
        "ik_syno_max": {
          "type": "custom",
          "tokenizer": "ik_max_word",
          "filter": [
            "my_synonym_filter"
          ]
        }
      }
    }
  },
  "mappings": {
    "_doc": {
      "properties": {
        "name": {
          "type": "text",
          "analyzer": "ik_syno_max",
          "search_analyzer": "ik_syno"
        }
      }
    }
  }
}

PUT /test11/_doc/1
{
  "name":"苹果"
}

GET /test11/_analyze
{
  "field": "name",
  "text": "气质好"
}

GET /test11/_search
{
  "query": {
    "match": {
      "name": "apple"
    }
  }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
近200节课,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。 课程内容介绍 (1)核心知识篇 课程特点 (1)使用最新Elasticsearch 5.2版本讲解,市面上的书籍和视频几乎都停留在2.x版本 (2)深入浅出ES核心工作原理,全部手工画图讲解,完全不同于市面上已有视频的PPT讲解 (3)涵盖Elasticsearch所有核心知识点,系统化,体系完整详细,有一定深度,包括完整Java开发示范 (3-1)全面的知识体系,包括了工作原理,文档管理,索引管理,搜索,聚合分析,分词,数据建模,Java API等知识 (3-2)知识足够深入和细节,完全秒杀市面上已有的书籍和视频,比如index segment merge原理,乐观锁并发控制,索引别名与零停机,相关度评分算法与定制,近似聚合算法,doc values与fielddata机制原理,父子关系数据建模,Java API执行scroll search等各种复杂操作,等等 (4)全程每讲必练,大量的案例实战和上机实验,实战出真知,实战中学知识,没有任何一讲是干讲ppt的 (5)包含一个实战项目,运用学到的知识,开发一个小型门户网站的搜索引擎和数据分析系统,运用ES几乎所有的核心知识,不像市面上的demo项目 (6)课程学完之后,学员可以掌握es所有核心知识点,理解es核心原理,而且能够熟练动手操作所有学到的知识和功能,并且能够掌握ES集群的基本部署,并且基于Java开发一个适用于中小型企业的搜索引擎以及数据分析系统,达到学完即可上手到中小型项目中使用的程度 (2)高手进阶篇 课程特点 (1)使用最新Elasticsearch 5.2版本讲解 (2)包含市面上几乎没有的所有Elasticsearch高级知识点:包含地理位置搜索与聚合分析,term vector,suggester search,搜索模板定制,query执行剖析,数十种最全面的聚合分析,span query,shard分配定制,es插件开发,等等,高级的知识点,这些知识点,市面上已有的书籍或视频几乎都没有 (3)全程每讲必练,大量的案例实战和上机实验 (4)包含一个复杂实战项目,运用学到的知识,开发一个复杂的基于地理位置的智能餐厅app的搜索引擎和数据分析系统,运用ES从核心篇到高级篇的所有高阶知识点 (5)课程学完之后,学员可以掌握es从核心到高阶的所有知识点,掌握完整的有深度的es知识体系,同时能够动手操作所有的知识点和功能,最后通过项目实战,能够在中小型公司中,基于Java开发一个可以基于地理位置进行搜索的高级搜索引擎,以及使用复杂聚合操作进行分析的高级实时数据分析系统 (3)大型集群运维优化篇 课程特点 (1)最全面的Elasticsearch运维、管理、调优、故障处理的知识体系:企业级监控体系的搭建,企业级集群部署,集群日常管理策略,集群版本升级方案,集群基准压测方案,集群数据的备份和恢复,系统核心配置参数,性能调优方案,故障处理方案 (2)全程每讲必练,大量上机实验,所有的运维、管理、部署、优化,全部上机实验 (3)从零开始,逐步搭建出一个大型可扩展、高性能、监控体系完善、管理体系健全的分布式集群 (4)学完课程之后,学员除了可以开发复杂的es搜索/分析系统之外,还可以掌握在任何一个公司里,从零开始搭建一个分布式的大型es集群,并制定完善的监控,运维,管理,优化等方案 (4)大型项目架构篇 课程特点 (1)涵盖Elasticsearch目前最核心的两个应用领域,垂直搜索引擎,实时数据分析 (2)开发出2个企业级的大型复杂项目,是完全真实的大型企业项目,电商搜索引擎,电商实时数据分析平台 (2-1)大型电商搜索引擎,包括了真正复杂的大型企业,大型项目的商业级搜索引擎架构,包括了检索、数据更新、排序、分词、query分析等各个核心模块,同时架构上实现了复杂的缓存机制,热启动机制,防雪崩机制,自动降级高可用机制,等等 (2-2)大型电商实时数据分析平台,完整、复杂而且大型的电商数据分析,包括了完善的数据分析指标体系(运营指标,流量指标,销售转化指标,客户价值指标,商品指标,营销指标,风险控制指标,市场竞争指标),一站式构建出复杂的,企业级的,电商领域数据分析平台 (2-3)之所以要单独拉出一篇做大型项目实战,是因为,之前几篇讲的项目,多是架构较为简单,业务也不复杂的项目,主要适用于中小型公司,而且那两个项目主要是集中在运用ES的技术本身来开发出需要的功能来(搜索/分析)。这一篇讲解的项目,重点是采用大公司的大型复杂项目作为背景,让同学可以掌握基于ES技术的大型项目架构能力,达到架构师的水平。比如说大型电商搜

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值