黑马es学习

黑马视频

官方使用手册

java client


0. 基础概念

es本质:一个基于Lucence开发出来的分布式搜索引擎

在这里插入图片描述

0.1 倒排索引

在这里插入图片描述

创建倒排索引后给词条创建索引,总计进行了两次查询

0.2 文档、索引

文档:一条数据记录
索引:类型相同的文档的集合

在这里插入图片描述

0.3 与mysql对比

交易等一致性要求高的mysql做
大范围搜索es做

1 基本操作

1.1 mapping 索引库操作

在这里插入图片描述
举例:注意object嵌套关系

在这里插入图片描述

禁止修改索引库,但是可以添加新字段

1.2 单个文档CRUD

文档查询:

在这里插入图片描述
_source字段下是查询到的原始文档

文档修改:
全量修改:旧的直接删除,新增改后的文档
增量修改:在旧的上面修改

在这里插入图片描述

3. DSL查询

dsl常见查询分类:

在这里插入图片描述

3.1 查询所有

在这里插入图片描述

3.2 全文检索

在这里插入图片描述
muti_match的方式能够额外指定针对哪些字段进行查询(任意一个字段包含即可)

3.3 精确查询

值是确定的,不可分割,不可分词,完全匹配

在这里插入图片描述

3.4 复合查询-相关性得分

相关性得分算法:(第三种 default)

es 自带的 query score:
在这里插入图片描述

自定义function score函数:

在这里插入图片描述

自定义score函数时主要确定三个部分:

  1. 哪些文档将进行加权
  2. 算分函数function score如何定义
  3. function score怎么与原始得分query score(BM25)进行加权

demo:

在这里插入图片描述

3.5 分页

深度分页问题:

在这里插入图片描述
from+size超过1w会直接报错,如果非要查一万条,不太现实,实际生产应用中会从业务层面避免查询1w条(从业务上拒绝),比如百度就是默认最多查70页,每页显示10条数据

在这里插入图片描述

3.6 高亮

高亮的结果解析是与_source同级的,需要额外注意:

在这里插入图片描述

3.7 总结

在这里插入图片描述

2. RestClient

将dsl语句对应到Java

在这里插入图片描述
在这里插入图片描述
上图中涉及了两个核心api:
source.query()/source()等:
在这里插入图片描述

QueryBuilders.各种查询query:
在这里插入图片描述

解析查询响应结果:

在这里插入图片描述

在这里插入图片描述

常见查询:

全文检索查询:
在这里插入图片描述
精确查询:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
聚合:

在这里插入图片描述

4. aggs聚合

聚合操作与query同级,用于对文档进行统计、分析、计算(min/max/avg…)

常见聚合方式:

在这里插入图片描述

4.1 bucket(分桶)聚合

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
默认按照doc_count降序排序,如若修改排序方式:

在这里插入图片描述

在这里插入图片描述

4.2 metrics聚合

在这里插入图片描述
红框:

聚合名称:scoreAgg
聚合类型:stats
聚合字段:score

5. mysql与es数据同步

在这里插入图片描述

方案一缺点:业务之间耦合度强,调用耗时

在这里插入图片描述
方案二缺点:依赖mq的可靠性

在这里插入图片描述
在这里插入图片描述

demo:基于mq的实现方式

mq的消息模式:其中交换机用于将消息路由

在这里插入图片描述

定义模式:
在这里插入图片描述
然后定义绑定关系:将某个队列绑定到指定交换机、用哪个routingKey:

在这里插入图片描述

消息发送(两种消息:增改(公用一个key)和删(另一个key)):

在这里插入图片描述
在这里插入图片描述

消息监听与消费:

定义监听:
在这里插入图片描述

具体实现:

在这里插入图片描述
在这里插入图片描述

6. es集群

集群化:每个节点有多个副本(分片),副本与原始数据不存在与同一台机器上,这样可以方式有人宕机的时候丢失数据
数据分散存储再不同机器上,提升了并发性,加速查询

企业级es集群有多少台?几千?

在这里插入图片描述

6.1 节点角色

在这里插入图片描述
主节点:处理传来的增删改查请求

数据节点要求高
协调节点对cpu要求高但是对磁盘要求不高

总结一下各个节点的作用:

在这里插入图片描述

6.2 脑裂问题

主节点由于网络问题暂时跟别人断连,剩余的人选举了一个新的老大,旧老大网络问题恢复之后发现集群中出现了两个老大,这就是脑裂问题

在这里插入图片描述

6.3 添加文档过程

在这里插入图片描述

在这里插入图片描述

6.4 查询过程

查所有节点再汇总

在这里插入图片描述

在这里插入图片描述

extra:es集群数据去重

  • 50
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值