自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(182)
  • 收藏
  • 关注

原创 ES 调优帖:关于索引合并参数 index.merge.policy.deletePctAllowed 的取值优化

Lucene 9.5 版本调整了 index.merge.policy.deletePctAllowed 参数的默认值,从 33% 降至 20%,并允许最小值为 5%。该参数控制索引中软删除文档的最大占比,调低该值可减少存储空间,但会增加 CPU 和内存资源消耗。软删除文档占比达到阈值时,会触发索引合并以物理删除这些文档。过低的 deletePctAllowed 会导致频繁合并,影响写入性能;过高的值则会导致存储空间浪费和查询性能下降。社区根据用户反馈调整了默认值,建议在生产环境中通过测试优化该参数。此外,

2025-05-20 23:29:29 707

原创 INFINI Console 纳管 Elasticsearch 9(一):指标监控、数据管理、DSL 语句执行

INFINI Console v1.29.2 已支持 Elasticsearch v9.0 集群管理。本文通过 Docker 快速部署 ES9 和 Console,并注册 ES9 到 Console 进行测试。测试内容包括指标监控、数据管理、DSL 语句执行等。使用 Loadgen 模拟数据写入和查询,验证了 Console 在平台概览、监控报表、数据管理和开发工具等方面的功能。测试结果表明,INFINI Console 能够有效管理 Elasticsearch 9 集群,用户可下载体验。

2025-05-14 00:09:23 416

原创 Easysearch 时序数据的基于时间范围的合并策略

Easysearch 1.12.1 版本引入了基于时间范围的合并策略 (TimeRangeMergePolicy),专为优化时序数据的 Segment 合并设计。默认的合并策略在处理时序数据时可能面临冷热数据混合、查询性能下降等问题。TimeRangeMergePolicy 通过优先合并时间上相邻的 Segment、避免跨度过大的合并以及优先处理新数据,显著降低了合并开销,提高了资源效率和查询性能。启用该策略只需确认时间字段并更新索引设置,适用于日志、监控指标等时序数据场景。

2025-05-13 23:52:35 1010

原创 Coco AI 入驻 GitCode:打破数据孤岛,解锁智能协作新可能

这正是诞生的契机——一款重新定义企业效率的智能中枢。,深度融合大语言模型技术,实现从"人找信息"到"信息追人"的范式革命。。通过连接 Google Workspace、Notion、语雀等 200+ 数据源,接入 DeepSeek 等大模型,构建企业级智能知识图谱,让数据真正流动起来,帮助企业高效管理和利用内外部数据资源。

2025-05-04 23:55:32 1164

原创 Easysearch 移除 Data 节点注意事项

之前介绍过 Easysearch 移除 Master 节点注意事项,感兴趣的小伙伴可以点此。本篇继续介绍移除 Data 节点注意事项,帮助运维人员最大限度降低操作的影响。

2025-05-03 23:11:02 257

原创 Easysearch 索引生命周期管理实战

如果你的使用场景是对时序型数据进行分析,可能你会更重视最新的数据,并且可能会定期对老旧的数据进行一些处理,比如减少副本数、forcemerge、 删除等。Easysearch 的索引生命周期管理功能,可以自动完成此类索引的管理任务。

2025-04-30 22:36:05 919

原创 Easysearch 迁移数据之 Reindex From Remote

本次主要测试从远程集群索引数据,reindex 还有很多其他使用方式,详情请参考官方文档。Easysearch版本:1.10.0,监听 localhost:9200Elasticsearch 版本:6.8.23,监听 localhost:9201版本:1.25.1(运行 reindex 命令用)针对临时数据量不大的场景可尝试使用 reindex 迁移数据。如果数据量大了,reindex 迁移速度不是很高效,而且如果中途出现错误迁移中断了,需要重新 reindex 不方便,建议使用。

2025-04-27 00:12:37 529

原创 Easysearch 移除 Master 节点注意事项

Easysearch 采用智能化的动态投票配置管理机制,当集群节点发生增删变更时,系统会自动调整投票集合配置,以确保集群的高容错性。在选举新的 Master 节点或提交集群状态变更时,系统会根据当前集群状态,动态确定参与投票的 Master-eligible 节点集合并进行计数,确保决策过程的高效性和可靠性。

2025-04-22 23:55:59 614

原创 Easysearch Rollup 相比 OpenSearch Rollup 的优势分析

查询接口的兼容性与无感知集成自动化的索引管理与扩展能力更丰富的聚合类型与表达能力针对性更强的性能优化参数灵活高效的任务批量管理机制这些优势使 Easysearch Rollup 更加适用于复杂、多样化的时序数据处理场景,特别是在对性能、扩展性与运维效率有较高要求的系统中表现出色。如果你正在寻找一款功能全面、易于管理的 Rollup 解决方案,Easysearch 是一个值得重点考虑的选择。

2025-04-21 23:37:07 568

原创 INFINI Console 系统集群状态异常修复方案

运行INFINI Console 1.29.0 和 1.29.1 版本的用户在新初始化平台后可能会遇到一个特定问题。如果后台的系统 Easysearch/Elasticsearch 集群(存储 Console 元数据的集群,通常名为或类似名称)包含超过一个节点的场景下, INFINI Console 会错误地报告系统集群健康状态异常(例如,显示为不可用)。而对于已存在的历史集群不会发生,如果有以上情况,单纯升级并不能解决问题。可以尝试本文的解决方案。

2025-04-20 22:58:52 951

原创 Operator 开发入门系列(一):Hello World

简单来说,Operator 是 Kubernetes 的扩展,它利用自定义资源(Custom Resources, CRs)来自动化管理应用程序。Operator 允许我们像管理 Kubernetes 内置资源一样管理复杂的应用程序,例如数据库、消息队列等。接下来,我们需要定义HelloWorld资源的结构。运行以下命令这个命令会创建一个新的 API 定义,包括和两个文件。编辑文件,修改的定义,添加name和message恭喜你完成了第一个 Operator!

2025-04-17 23:51:53 948

原创 Easysearch 自动备份:快照生命周期管理

之前介绍了 Easysearch 如何使用 S3 进行快照备份,毕竟那是手工操作。Easysearch 还提供了,能够按照策略自动创建、删除快照,极大地方便了用户的日常管理。快照生命周期管理计划由创建计划、删除计划以及快照配置组成。快照生命周期创建的快照名称格式为。比如, 计划每 2 分钟对索引 .infini_metrics-00001 创建一个快照,并且只保留最近的 2 个快照。自动创建的快照如下图,一个 16 点 34 分创建的,另一个 16 点 36 分创建的。

2025-04-15 12:35:14 612

原创 Easysearch S3 备份实战

Easysearch 内置了 S3 插件,这意味着用户可以直接使用该功能而无需额外安装任何插件。通过这一内置支持,用户能够方便快捷地执行 Amazon S3 上的数据快照操作。这种设计不仅简化了配置流程,也提高了工作效率,使得数据备份或迁移等任务变得更加简单易行。对于需要频繁与 S3 存储服务交互的应用场景来说,这是一个非常实用且高效的功能特性。

2025-04-13 18:26:49 549

原创 如何使用 Grafana 连接 Easyearch

Grafana 是一款开源的跨平台数据可视化与监控分析工具,专为时序数据(如服务器性能指标、应用程序日志、业务数据等)设计。它通过直观的仪表盘(Dashboards)帮助用户实时监控系统状态、分析趋势,并支持告警功能,是 DevOps、运维团队和数据分析师的重要工具。目前 Grafana 已经支持使用 Elasticsearch 作为数据源,由于 Easysearch 兼容 Elasticsearch 的 API,所以 Grafana 也可使用 Easysearh 作为数据源。

2025-04-12 23:32:55 454

原创 Easysearch VS Opensearch 数据写入与存储性能对比

本文记录 Easysearch 和 Opensearch 数据写入和数据存储方面的性能对比。

2025-04-09 23:59:28 387 1

原创 INFINI Labs 产品更新 | Coco AI 0.3 发布 – 新增支持 Widget 外部站点集成

INFINI Labs 产品更新发布!此次更新涵盖 Coco AI 、Easysearch 等产品多项重要升级,重点提升 AI 搜索能力、易用性及企业级优化。

2025-04-07 23:21:03 707

原创 代理 Elasticsearch 服务:INFINI Gateway VS Nginx

是一款面向 Elasticsearch 的高性能应用网关,专为提升 Elasticsearch 集群的性能、安全性和可管理性而设计。它作为 Elasticsearch 的前置网关,能够处理所有客户端请求,并将其转发到后端的 Elasticsearch 集群,同时提供丰富的功能来优化请求处理和管理。此外还支持代理 Opensearch、Easysearch服务。

2025-04-07 00:02:00 635

原创 如何使用 Nginx 代理 Easysearch 服务

Nginx 是一个高性能的 HTTP 服务器和反向代理服务器,广泛用于负载均衡、缓存、SSL 终端和服务代理等场景。本篇将尝试使用 Nginx 代理 Easysearch 服务,方法同样适用于 Elasticsearch 和 Opensearch。

2025-04-05 23:57:09 486

原创 实现极限网关(INFINI Gateway)配置动态加载

INFINI Gateway 是一个开源的面向搜索场景的高性能数据网关,所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway,可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。今天和大家分享一个 Gateway 的功能:动态加载配置(也称热更新或热加载)。这个功能可以在 Gateway 不停机的情况下更新配置并使之生效。从日志中可以看出修改后的配置文件已经加载。启动 Gateway,配置自动加载开启。

2025-03-26 23:55:01 389

原创 通过 INFINI Console 集中管理极限网关配置

之前有做过介绍实现极限网关(INFINI Gateway) 配置动态加载,这是一个 Gateway 实例的操作,直接在服务器上修改配置文件。如果有多个 Gateway 实例需要调整,登录多台主机修改配置文件就有些繁琐,有没有简便的方法呢?答案是: 当然有!INFINI Gateway 有配套的管理页面,那就是 INFINI Console。Gateway 注册到 Console 后,就可以在如下的页面上进行管理。其中 Config 可以查看到当前 Gateway 的配置。当然不止有查看功能,也可以在这里修改

2025-03-20 10:38:49 452

原创 使用 INFINI Gateway 保护 Elasticsearch 集群之修改查询不合理参数(二)

本文将探讨如何使用 INFINI Gateway 修改查询不合理的参数,此方法同样适用于 Opensearch 和。在之前的中,我们介绍了如何使用 request_body_json_set 处理器修改不合理的查询参数,本篇将继续探讨如何使用 request_body_regex_replace 处理器修改不合理参数。试想一下有下面两种查询,如果只想修改第二个查询的 size 到 10 该如何做?如果要继续使用 request_body_json_set 处理器则必须加上条件判断。

2025-03-17 23:50:02 742

原创 使用 INFINI Gateway 保护 Elasticsearch 集群之修改查询不合理参数(一)

本文将探讨如何使用 INFINI Gateway 修改查询不合理的参数,此方法同样适用于 Opensearch 和 INFINI Easysearch。在之前的中,我们介绍了如何阻断不合理的查询。有些不合理查询是本身就非常消耗资源,比如模糊查询、嵌套聚合等。还有些不合理查询是因为指定了不合理的参数导致非常消耗资源,比如深度分页、profile 查询等。

2025-03-16 13:23:51 894

原创 Easysearch 节点磁盘不足应对方法

为了防止索引将磁盘空间完全占满,使用磁盘水位线进行磁盘空间控制。之前有提过不同水位线的作用,以及如何使用 INFINI Console 提前进行告警,提前进行处理。本篇主要探讨提前处理的情况。

2025-03-13 23:01:35 428

原创 Easysearch 磁盘水位线注意事项

为了防止索引将磁盘空间完全占满,使用磁盘水位线进行磁盘空间控制。。

2025-03-12 23:43:58 274

原创 INFINI Labs 产品更新 | Easysearch 增加异步搜索等新特性

INFINI Labs 产品更新发布!此次更新,Easysearch 增加了新的功能和数据类型,包括 wildcard 数据类型、Point in time 搜索 API、异步搜索 API、数值和日期字段的 doc-values 搜索支持,Console 新增了日志查询功能。

2025-03-09 23:43:14 1082

原创 Easysearch 新功能: IK 字段级别词典

自定义词库的生效主要通过自定义 tokenizer 进行设置。},},其中custom_dict_enable:布尔值,默认 false,true 则可以定制词典读取路径,否则 load_default_dicts / dict_key / dict_index 均失效。load_default_dicts:布尔值,默认 true,定制的词典是否包含默认的词典库。lowcase_enable:布尔值,默认为 true,是否大小写敏感,false 则保留原来文本的大小写。

2025-03-07 23:51:00 1038

原创 INFINI Labs 推出 Coco AI,携手 DeepSeek 打造下一代企业知识管理神器!

随着企业信息化程度的飞速提升,海量数据正以前所未有的速度涌现,这些数据分散在内网 Wiki、JIRA、Google Workspace、Dropbox、Notion、GitHub 等多个平台中,形成了一个个难以逾越的“信息孤岛”。员工们在跨平台检索信息时,常常陷入“大海捞针”的困境,不仅浪费了大量时间,还严重影响了工作效率。与此同时,AI 技术的飞速发展为知识管理和信息检索带来了新的曙光。

2025-03-03 23:52:13 850

原创 谈谈 ES 6.8 到 7.10 的功能变迁(6)- 其他

Elasticsearch 7.0 引入了新一代的函数分数功能,称为查询。这一新功能提供了一种更简单、更灵活的方式来为每条记录生成排名分数。查询由一组函数构成,包括算术函数和距离函数,用户可以根据需要混合和匹配这些函数,以构建任意的分数计算逻辑。这种模块化的结构使得使用更加简便,同时也为更多用户提供了这一重要功能的访问权限。通过,用户可以根据复杂的业务逻辑自定义评分,而不仅仅依赖于传统的 TF-IDF 或 BM25 算法。

2025-03-02 00:00:43 829

原创 谈谈 ES 6.8 到 7.10 的功能变迁(5)- 任务和集群管理

这一篇我们继续了解 ES 7.10 相较于 ES 6.8 调优的集群管理和任务管理的方法,主要有断联查询的主动取消、投票节点角色、异步查询和可搜索快照四个功能。

2025-02-26 22:51:58 713

原创 谈谈 ES 6.8 到 7.10 的功能变迁(4)- 聚合功能篇

一个管道聚合,对于一组有序的百分位数,移动百分位数聚合(Moving Percentile Aggregation)会在这些百分位数上滑动一个窗口,并计算累积百分位数。

2025-02-25 21:20:13 803

原创 谈谈 ES 6.8 到 7.10 的功能变迁(3)- 查询方法篇

Interval 查询,词项间距查询,可以根据匹配词项的顺序、间距和接近度对文档进行排名。主要解决的查询场景“创建一个多搜索词匹配的查询,同时保留搜索词的顺序”,比 match phrase 更加符合需求场景,查询方法使用比 span 查询更简单。ES 后续版本想用 interval 查询逐步替代 span 查询。

2025-02-24 23:59:55 798

原创 谈谈 ES 6.8 到 7.10 的功能变迁(2)- 字段类型篇

我们继续来了解一下从 ES 6.8 到 ES 7.10 新增的功能。本篇主要介绍新增的字段类型,会简要概述一下新增字段类型的使用场景和限制,提供简单的测试代码。

2025-02-23 09:16:59 1133

原创 谈谈 ES 6.8 到 7.10 的功能变迁(1)- 性能优化篇

ES 7.10 可能是现在比较常见的 ES 版本。但是对于一些相迭代比较慢的早期业务系统来说,ES 6.8 是一个名副其实的“钉子户”。借着工作内升级调研的任务东风,我整理从 ES 6.8 到 ES 7.10ELastic 重点列出的新增功能和优化内容。将分为 6 个篇幅给大家详细阐述。本系列文章主要针对Elasticsearch 传统的使用功能和基础的模块,像是集群任务的管理、搜索、聚合还有字段类型这样的功能。对于付费功能或者全新的模块,比如:CCR、机器学习和数据流,这里不去深入探讨。

2025-02-19 23:31:39 966

原创 使用 INFINI Gateway 保护 Elasticsearch 集群之阻断不合理的查询

本文将探讨如何使用 INFINI Gateway 阻止不合理的查询发送到 Elasticsearch,此方法同样适用于 Opensearch 和。在以往处理 Elasticsearch OOM(内存溢出)问题的经验中,我们发现许多案例是由于查询操作导致节点出现 OOM 的情况。经过调查,这些案例主要分为两类:一类是由于查询吞吐量超出了集群的处理能力,另一类则是在执行某些不合理的查询时触发了 OOM。通过识别并优化这些查询模式,可以有效减少 OOM 事件的发生。针对查询吞吐量过高的情况,可以参考之前的。

2025-02-19 00:20:56 631

原创 引爆知识革命!Easysearch 携手 DeepSeek 打造下一代智能问答系统

去年我们尝试过使用 Easysearch + 千问 2 大模型打造一个,今年又有更加给力的大模型出现了–DeepSeek,性能对标 OpenAI o1 正式版。而且 Easysearch 对比去年也有了不少进步,是时候让我们升级下问答系统了。

2025-02-17 00:44:13 792

原创 Easysearch 写入限速实战

有给 ES 系统导入过数据的小伙伴都知道,给一个正在执行查询的 ES 集群导入数据,可能会影响查询的响应时间。如果导入的数据量还比较大,那请将“可能”两个字去掉。这种操作通常被限定在业务低谷期执行,如果一定要立即操作,则必须非常小心控制写入速度,避免影响到业务查询。INFINI从 1.8.0 版本开始引入了写入限速功能,靠引擎自身能力对写入速度进行限制。不仅听着简单,实际用起来一点也不麻烦,我们赶紧实战一把。

2025-02-16 20:07:35 747

原创 Easysearch 证书:Windows 上创建自签名证书的 7 种方法

在 Windows 上创建自签名证书对于开发者和管理员来说是一项常见任务。自签名证书通常用于测试环境、开发、或者是没有商业证书的情况下使用。本文所述在 Windows 上创建自签名证书的 7 种方法都有详细步骤和验证方式,希望能给你带来帮助。参考资料如何使用 XCA 创建证书。

2025-02-12 10:17:50 1053

原创 如何使用 DataX 连接 Easysearch

每个数据同步的操作可称为一个任务,任务的配置文件定义了数据源(reader)、数据目的(writer) ,以及任务的设置信息,如并发数、速度控制等。DataX 是阿里开源的一款离线数据同步工具,致力于实现包括关系型数据库(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能。本篇主要介绍 DataX 如何将数据写入到 Easysearch,对于各种数据源的连接不会做深入的探讨,感兴趣的小伙伴可以访问。的 Github 仓库查看详情。

2025-02-09 16:55:18 859

原创 INFINI Labs 产品更新 - Easysearch 增强 Rollup 能力,Console 完善 TopN 指标等

INFINI Labs 产品更新发布!此次更新,Easysearch 增强 Rollup 能力,支持更多的聚合方式;Console 完善了 TopN 的指标,支持自定义视图,并内嵌视图模板;Gateway 进行了多处优化以及修复相关 Bug 等等。欢迎下载体验,探索更多可能!

2025-02-08 02:32:27 699

原创 如何使用 Filebeat 8 连接 Easysearch

Easysearch-1.9.0 必须开启第一个兼容参数,此时检测到的版本是 7.10.2。也可同时开启两个兼容性参数,此时检测到的版本是 8.9.0。Filebeat 必须关闭模板导入功能。

2025-02-07 01:00:32 716

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除