Elasticsearch
文章平均质量分 79
weixin_42073629
这个作者很懒,什么都没留下…
展开
-
Elasticsearch的倒排索引理解
Elasticsearch的倒排索引转载 2023-05-01 14:09:24 · 411 阅读 · 1 评论 -
ES+Redis+MySQL,高可用架构设计
背景会员系统是一种基础系统,跟公司所有业务线的下单主流程密切相关。如果会员系统出故障,会导致用户无法下单,影响范围是全公司所有业务线。所以,会员系统必须保证高性能、高可用,提供稳定、高效的基础服务。随着同程和艺龙两家公司的合并,越来越多的系统需要打通同程 APP、艺龙 APP、同程微信小程序、艺龙微信小程序等多平台会员体系。例如微信小程序的交叉营销,用户买了一张火车票,此时想给他发酒店红包,这就需要查询该用户的统一会员关系。因为火车票用的是同程会员体系,酒店用的是艺龙会员体系,只有查到对应的转载 2022-04-10 15:49:29 · 198 阅读 · 0 评论 -
Elasticsearch之 cerebro
cerebro is an open source(MIT License) elasticsearch web admin tool built using Scala, Play Framework, AngularJS and Bootstrap.celebro 是一个Elasticsearch的web 管理工具,基于scala,play框架和angularJS和Bootstrap前端工具构建。可以看到cerebro是对Elastic监控的工具,和对Elastic操作的工具。https://vk转载 2021-09-05 10:11:59 · 133 阅读 · 0 评论 -
SpringBoot+Kafka+ELK 完成海量日志收集
整体流程大概如下:服务器准备在这先列出各服务器节点,方便同学们在下文中对照节点查看相应内容图片推荐下自己做的 Spring Boot 的实战项目:https://github.com/YunaiV/ruoyi-vue-proSpringBoot项目准备引入log4j2替换SpringBoot默认log,demo项目结构如下:图片pom<dependencies><dependency><gro...原创 2021-09-04 17:41:46 · 154 阅读 · 0 评论 -
es从系统到配置到使用调优
一、配置文件调优elasticsearch.yml内存锁定bootstrap.memory_lock:true 允许 JVM 锁住内存,禁止操作系统交换出去。zen.discoveryElasticsearch 默认被配置为使用单播发现,以防止节点无意中加入集群。组播发现应该永远不被使用在生产环境了,否则你得到的结果就是一个节点意外的加入到了你的生产环境,仅仅是因为他们收到了一个错误的组播信号。ES是一个P2P类型的分布式系统,使用gossip协议,集群的任意请求都可以发送到集群的任一节原创 2021-09-04 12:37:46 · 250 阅读 · 0 评论 -
ElasticSearch实用化订单搜索方案
一、为什么选择ES搜索引擎中,主要考虑到ES支持结构化数据查询以及支持实时频繁更新特性:二、总体系统架构整个业务线使用服务化方式,ES集群和数据库分库,作为数据源被订单服务系统封装为对外统一接口;各前后台应用和报表中心,使用服务化的方式获取订单数据。三、数据更新设计ES数据更新有批量更新和实时更新两种:1、手动更新为初始化数据,或者修复数据时使用2、实时更新通过监控数据库订单表的binlog,进行实时同步四、机器、索引、参数配置五、...原创 2021-03-28 20:24:41 · 1032 阅读 · 0 评论 -
Elasticsearch 实践调优
1、内存Elasticsearch 和 Lucene 都是 Java 语言编写,这意味着我们必须注意堆内存的设置。Elasticsearch 可用的堆越多,它可用于过滤器(filter)和其他缓存的内存也就越多,更进一步讲可以提高查询性能。但请注意,过多的堆可能会使垃圾回收暂停时间过长。请勿将堆内存的最大值设置为 JVM 用于压缩对象指针(压缩的 oops)的临界值之上,确切的临界值有所不同,但不要超过 32 GB。常见内存配置坑 1:堆内存设置过大举例:Elasticsearch 宿主原创 2021-03-21 02:48:43 · 231 阅读 · 0 评论 -
Elasticsearch 系列文章(四):ElasticSearch 单个节点监控
集群健康监控是对集群信息进行高度的概括,节点统计值 API 提供了集群中每个节点的统计值。节点统计值很多,在监控的时候仍需要我们清楚哪些指标是最值得关注的。集群健康监控可以参考这篇文章:ElasticSearch 集群监控节点信息 Node Info :curl -XGET 'http://localhost:9200/_nodes'执行上述命令可以获取所有 node 的信息_nodes: { total: 2, successful: 2, failed: 0},.原创 2021-03-07 16:33:29 · 371 阅读 · 0 评论 -
Elasticsearch 系列文章(三):ElasticSearch 集群监控
最近在做 ElasticSearch 的信息(集群和节点)监控,特此稍微整理下学到的东西。这篇文章主要介绍集群的监控。要监控哪些 ElasticSearch metricsElasticsearch 提供了大量的 Metric,可以帮助您检测到问题的迹象,在遇到节点不可用、out-of-memory、long garbage collection times 的时候采取相应措施。但是指标太多了,有时我们并不需要这么多,这就需要我们进行筛选。集群健康一个 Elasticsearch 集群至原创 2021-03-07 16:29:51 · 381 阅读 · 0 评论 -
Elasticsearch 系列文章(二):全文搜索引擎 Elasticsearch 集群搭建入门教程
介绍ElasticSearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful web 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。基百科、Stack Overflow、Github 都采用它。本文从零开始,讲解如何使用 Elasticsearch 搭建自己的全文搜索引擎。每一步都有详细原创 2021-03-07 16:21:54 · 336 阅读 · 0 评论 -
Elasticsearch 系列文章(一):Elasticsearch 默认分词器和中分分词器之间的比较及使用方法
介绍:ElasticSearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful web 接口。Elasticsearch 是用 Java 开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。Elasticsearch中,内置了很多分词器(analyzers)。下面来进行比较下系统默认分词器和常用的中文分词器之间的区别。1、standard 分词器原创 2021-03-07 15:49:38 · 487 阅读 · 0 评论 -
Elasticsearch 缓存深入详解
1、Elasticsearch 缓存引出Elasticsearch 查询的响应需要占用 CPU、内存资源,在复杂业务场景,会出现慢查询,需要花费大量的时间。如何破局呢?增加集群硬件配置会有高昂硬件开销。还有没有其他方案呢?这时候会想到:缓存。Elasticsearch 有哪些缓存,不同缓存的应用场景是什么呢?本文给出答案。2、Elasticsearch 缓存经常被问道的问题汇总 怎样知道自己的查询时命中缓存了还是走的磁盘搜索? 我想每次查询的时候直接显示几个小时以前的数据 而原创 2021-03-04 19:31:32 · 1019 阅读 · 1 评论 -
Elasticsearch查询操作(二)
地理坐标点geo-point地理坐标点:是指地球表面可以用经纬度描述的一个点。 地理坐标点可以用来计算两个坐标间的距离,还可以判断一个坐标是否在一个区域中,或在聚合中。地理坐标点不能被动态映射(dynamic mapping)自动检测,而是需要显式声明对应字段类型为geo-point,经纬度信息的形式可以是字符串(“lat,lon”)、数组([lon,lat])、对象({“lat”: xxx, “lon”: xxx}), 注意字符串和数组的经纬度顺序不一致。longitude:经度latitu原创 2020-12-01 01:22:35 · 386 阅读 · 0 评论 -
Elasticsearch查询操作(一)
// 准备数据PUT /shop/goods/1{ "name": "2017新款女装冬季外套ulzzang棉袄中长款棉衣韩版百搭棉服面包服", "desc": "", "price": 268, "quantity": 9267, "colors": [ "绿色", "黑色" ], "is_discount": true, "create_date": "2018-01-31 12:10:30", "ip_addr": "192.168.10.1", "locatio.原创 2020-12-01 01:08:09 · 713 阅读 · 0 评论 -
Elasticsearch文档CURD操作
一: 新增文档POST /{index}/{type}或PUT /{index}/{type}/{id}注意:新增文档时可以显式指定id,id可以是数字也可以是字符串,如果不显示指定id,系统会自动生成一个唯一的id值PUT /shop/goods/1{ "name": "Apple/苹果 iPhone X", "price": 9688.00, "quantity": 999, "colors": ["银色", "深空灰色"], "is_discou..原创 2020-12-01 00:54:43 · 235 阅读 · 0 评论 -
Elasticsearch详情
一、Elasticsearch核心概念基本概念介绍Elasticsearch是一个基于Lucene构建的开源、分布式、RESTful的搜索引擎,能够实现近实时(NRT)搜索,稳定、可靠、安装方便。Elasticsearch 不仅是一种全文索引技术,也是一种面向文档型NOSQL数据库。一个采用Restful API标准的高扩展性和高可用性的实时数据分析的全文搜索工具。名词解释Cluster(集群):一个集群就是由一个或者多个node组成在一起,共同工作,共同分享整个数据具有负载均衡的集群 N原创 2020-12-01 00:50:56 · 248 阅读 · 0 评论 -
Logstash参数最全详解
Logstash参数与配置Logstash宏观的配置文件内容格式如下:# 输入input { ...}# 过滤器filter { ...}# 输出output { ...}配置文件参考input { # 从文件读取日志信息 file { path => "/var/log/error.log" type => "error"//type是给结果增加一个type属性,值为"error"的条目 .原创 2020-11-26 02:23:50 · 12947 阅读 · 0 评论 -
ELK、FILEBEAT 日志分析平台搭建
一、ELK介绍1.ELK简介如今,绝大部分系统都是一个分布式的环境,机器分布在不同的环境中。而如果我们需要去查看日志信息,按照以前的方式一台台登录去查看,效率非常低,而且很耗时间。所以这里需要一个集中式的日志存储分析系统。而一个集中式的日志存储系统又以下几个特点:收集-能够采集多种来源的日志数据 传输-能够稳定的把日志数据传输到中央系统 存储-如何存储日志数据 分析-可以支持 UI 分析 警告-能够提供错误报告,监控机制而目前市面上Splunk都满足上述特点,而且非常优秀,但是它是一款原创 2020-11-25 03:01:50 · 711 阅读 · 0 评论 -
ELK + Filebeat + Kafka 分布式日志管理平台
一.先描述一下使用这种框架搭建平台的工作流程。二.对上面的工作流程进行简单描述。(1)将filebeat部署到需要采集日志的服务器上,filebeat将采集到的日志数据传输到kafka中。(2)kafka将获取到的日志信息存储起来,并且作为输入(input)传输给logstash。(3)logstash将kafka中的数据作为输入,并且把kafka中的数据进行过滤等其他操作,然后把操作后得到的数据输入(output)到es(elasticsearch)中。(4)es(基于lucene原创 2020-11-25 01:17:04 · 287 阅读 · 0 评论 -
Spring Boot 日志平台 ELK + Filebeat 入门
1. 概述在《芋道 Spring Boot 日志集成 Logging 入门》文章中,我们学习了 Spring Boot 如何集成并使用日志框架,进行日志的打印。友情提示:对于本文来说,即使胖友未阅读过《芋道 Spring Boot 日志集成 Logging 入门》文章,也毫无影响,不要慌~不过正如我们在文末所说,在生产环境下,我们会集群部署我们的应用。那么我们可能需要登陆多台服务器,查看不用应用节点下的日志,这样会非常不方便。所以,本文我们就一起来,使用 ELK + Filebeat 组原创 2020-06-16 02:06:23 · 2090 阅读 · 0 评论 -
ELK(Elasticsearch + Logstash + Kibana) 极简入门
1. 概述在线上问题排查时,通过日志来定位是经常使用的手段之一,甚至是最有效的。线上服务为了实现高可用往往采用多节点部署,又或者随着项目愈发复杂会考虑微服务架构,导致日志分散在不同的服务器上,导致排查一个问题,需要登录多台服务器,查询在其上的日志,非常繁琐且低效。所以,此时我们需要一个统一的实时【日志服务】,将我们需要的日志全部收集在一起,并提供灵活的查询功能。一般来说,一个完整的日志服务,需要提供如下 5 个功能:1、收集 :能够采集多个来源的日志数据。 2、传输 :能够稳定的把日志数据原创 2020-11-25 01:03:57 · 767 阅读 · 0 评论 -
Elasticsearch 极简入门
1. 单机部署考虑到阿里云 Elasticsearch 使用 6.7.X 版本,本小节我们基于 6.7.2 版本进行安装部署。前置准备:1、安装 JDK 。2、修改/etc/security/limits.conf,在此配置中增加以下内容。如果服务器已经配置好,可以不用重复配置。需要在 Root 下执行。root soft nofile 65535root hard nofile 65535* soft nofile 65535* hard nofile 6553..原创 2020-11-25 00:40:50 · 315 阅读 · 0 评论 -
Spring Boot Elasticsearch 入门
1. 概述如果胖友之前有用过 Elasticsearch 的话,可能有过被使用的 Elasticsearch 客户端版本搞死搞活。如果有,那么一起握个抓。所以,我们在文章的开始,先一起理一理这块。Elasticsearch(ES)提供了两种连接方式: transport :通过 TCP 方式访问 ES 。 对应的库是org.elasticsearch.client.tran...原创 2020-04-28 23:11:26 · 518 阅读 · 0 评论
分享