《专题三分布式系统》之《第四章 拓展进阶(二)——搜索引擎ES》

《4.12.1 搜索引擎核心理论思想视频》

  • 10 45 数据库适合结构化数据的精确查询,不适合半结构化、非结构化数据的模糊查询及灵活搜索
  • inverted index 反向索引(倒排索引)
  • 22分 中文分词器:在这里插入图片描述
  • 26 17 在反向索引中包含词出现的次数及位置:
    在这里插入图片描述
  • 30 40 搜索的步骤:
  1. 对搜索的输入分词
  2. 度量相关性
    视频中提出的度量相关性方案:统计词语在文档中出现的次数(可对在标题中出现的给予更高权重)
    应该还有其它方案,比如余弦相似性:https://blog.csdn.net/qq_23204557/article/details/103021370

《4.12.2 ES应用场景及核心概念》

  • 9分 Elasticsearch架构:
    在这里插入图片描述

  • 37分 通过index alias解决db与es之间的数据同步问题

  • 47 45 分片的好处:扫描时间因为单机数据减少而减少。多副本可以提高可用性和吞吐量。这点可参考1
    在这里插入图片描述

  • 62 39 index, mapping type, document : Elasticsearch Concepts You Need to Learn 我在1有相关讨论总结。

  • 1:45:07 _routing field :
    在这里插入图片描述
    ElasticSearch面试题 之 4.详细描述一下Elasticsearch索引文档的过程 也有提到:

默认使用文档ID参与计算(也支持通过routing),以便为路由提供合适的分片。   
shard = hash(document_id) % (num_of_primary_shards)

这点很像kafka的生产者可根据消息的key决定投递到哪个partition.

  • 在这里插入图片描述

《4.12.4 ES高级查询》

  • es里用suggester实现查询建议(包括拼写检查,和自动补全)

《4.12.5 ES高性能集群》

《4.12.6 ELK》

  • ELK是ElasticSearch Logstash Kibana三者的缩写:
    在这里插入图片描述
  • 8分 ELK老的架构如下图。缺点:Logstash是一种比较重的agent
    在这里插入图片描述
  • 架构2:用beats进行日志采集,用Logstash分析:
    在这里插入图片描述
  • 12 35 Metricbeat可以收集主机的内存情况、CPU情况、磁盘IO、网络IO等等
  • Filebeat: 日志文件采集器
  • 50 40 当机器太多,日志太多,Logstash有点受不了了,可以加个Kafka集群:
    在这里插入图片描述

我找的ElasticSearch面试题


  1. 本博—《专题五 容器化微服务》之《第三章 云原生DevOps》之《第二节 监控》之《3.2.3 Elasticsearch与Kibana》 ↩︎ ↩︎

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_23204557

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值