搜索引擎ElasticSearch的理解和学习


elasticsearch安装部署详细教程

一、什么是倒排索号?有什么好处?

索引:从ID到内容。
倒排索引:从内容到ID。好处:比较适合做关键字检索。可以控制数据的总量。提高查询效率。
搜索引擎为什么比MySQL查询快? lucence
文章-》term->排序 term dictionary -> term index-》 Posting List->1文章/D,[在文章中出现的偏移量],权重

二、ES了解多少?说说你们公司的ES集群架构。

ES:是一个基于Lucene框架的搜索引擎产品。you know for search。提供了Restful风格的操作接口。 ELK
Lucene:是一个非常高效的全文检索引擎框架。java jar
ES的一些核心概念:
1、索引 index:关系型数据库中的table
2. X* document : row
3、字段 field textlkeywordlbyte:列
4、映射Mapping :Schema。
5、查询方式 DSL: SQL ES的新版本也支持SQL
6、分片 sharding 和副本 replicas: index都是由sharding组成的。每个sharding都有一个或多个备份。 ES集群健康状态
ES的使用场景。ES可以用在大数据量的搜索场景下,另外ES也有很强大的计算能力。用户画像

三、如何进行中文分词?用过哪些分词器?

ik分词器

四、ES写入数据的工作原理是什么?

1、客户端发写数据的请求时,可以发往任意节点。这个节点就会成为coordinating node协调节点。
2、计算的点文档要写入的分片:计算时就采用hash取模的方式来计算。
3、协调节点就会进行路由,将请求转发给对应的primary sharding所在的datanode.
4、 datanode节点上的primary sharding处理请求,写入数据到素引1库,并且将数据同步到对应的replica sharding
5、等primary sharding 和rerlica shardinq都保存好文档了之后,返回客户端响应。
在这里插入图片描述

五、ES查询数据的工作原理是什么?

1、客户端发请求可发给任意节京,这个节点就成为协调节点
2、协调节点将查询请求广播到每一个数据节点,这些数据节点的分片就会处理改查询请求。
3、每个分片进行数据查询,将符合条件的数据放在一个队列当中,并将这些数据的文档1D、节点信息、分片信息都返回给协调调节点。
4、由协调节点将所有的结果进行汇总,并排序。
5、协调节点向包含这些文档1D的分片发送get请求,对应的分片将文档数据返回给协调节点,最后协调节点将数据整合返回给客户端。

六、ES部署时,要如何进行优化?

1、集群部署优化。
调整ES的一些重要参数。path.data目录尽量使用SSD。定时!VM堆内存大小。
关于ES的参数,大部分情况下是不需要调优的,如果有性能问题,最好的办法是安排更合理的sharding布局并且增加节点数量。
2、更合理的sharding布局:
让sharding和对应的replica sharding尽量在同一个机房。
3、Linux服务器上的一些优化策略:
不要用root用户;修改虚拟内存大小;修改普通用户可以创建的最大线程数。
ES生态:ELK日志收集解决方案-filebeat(卖1g日志)->logstash ->ElasticSearch->kibana、Srafana、自研的报表平台

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱喝皮蛋瘦肉粥的小饶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值