铭毅天下

【死磕Elasticsearch知识星球】http://t.cn/RmwM3N9;【Elasticsearch微信公众号】铭毅天下;【死磕ElasticsearchQQ群】626036393...

排序:
默认
按更新时间
按访问量

《死磕 Elasticsearch 方法论》:普通程序员高效精进的 10 大狠招!(完整版)

人工智能、大数据快速发展的今天,对于 TB 甚至 PB 级大数据的快速检索已然成为刚需。Elasticsearch 作为开源领域的后起之秀,从2010年至今得到飞跃式的发展。 Elasticsearch 以其开源、分布式、RESTFul API 三大优势,已经成为当下风口中“会飞的猪”。 阿里云...

2018-02-08 20:45:36

阅读数:12763

评论数:8

Elasticsearch深入详解-知识图谱(每周更新)

1、题记 Elasticsearch技术已经燃爆到飞的感觉。 为了方便订阅Elasticsearch深入详解的博友们第一时间获取最新经验分享,和大家一起成长,特将本专栏内容制作为Elasticsearch深入详解知识图谱。 并承诺【铭毅天下】微信公众号每周不定时推送ES深入研究文章至少一篇...

2017-08-19 11:13:59

阅读数:14011

评论数:2

Elasticsearch学习,请先看这一篇!

题记:Elasticsearch研究有一段时间了,现特将Elasticsearch相关核心知识、原理从初学者认知、学习的角度,从以下9个方面进行详细梳理。欢迎讨论……0. 带着问题上路——ES是如何产生的?(1)思考:大规模数据如何检索?如:当系统数据量上了10亿、100亿条的时候,我们在做系统架...

2016-08-18 21:08:36

阅读数:95738

评论数:27

Elasticsearch的使用场景深入详解

了解了ES的使用场景,ES的研究、使用、推广才更有价值和意义。1、场景—:使用Elasticsearch作为主要的后端传统项目中,搜索引擎是部署在成熟的数据存储的顶部,以提供快速且相关的搜索能力。这是因为早期的搜索引擎不能提供耐用的​​存储或其他经常需要的功能,如统计。 Elasticsea...

2016-08-17 08:40:56

阅读数:49341

评论数:9

为什么Elasticsearch查询变得这么慢了?

0、引言 Elasticsearch社区中经常看到慢查询问题:“你能帮我看看Elasticsearch的响应时间吗?”或者是:“我的ES查询耗时很长,我该怎么做?” 包含但不限于:Nested慢查询、集群查询慢、range查询慢等问题。 1、两个维度 每当我们得到这些类型的问题时,我们...

2018-10-14 16:05:30

阅读数:280

评论数:0

干货 | Elasticsearch Nested类型深入详解

0、概要 在Elasticsearch实战场景中,我们或多或少会遇到嵌套文档的组合形式,反映在ES中称为父子文档。 父子文档的实现,至少包含以下两种方式: 1)父子文档 父子文档在5.X版本中通过parent-child父子type实现,即:1个索引对应多个type; 6.X+版本已...

2018-10-06 13:08:20

阅读数:183

评论数:0

干货 | 通透理解Elasticsearch聚合

使用Elasticsearch的过程中,除了全文检索,或多或少会做统计操作,而做统计操作势必会使用Elasticsearch聚合操作。 类似mysql中group by的terms聚合用的最多,但当遇到复杂的聚合操作时,往往会捉襟见肘、不知所措… 这也是社区中聚合操作几乎每天都会被提问的原因。...

2018-10-03 16:53:36

阅读数:484

评论数:0

软技能,程序员编程之外的升值之道!

题记 程序员,除了编码之外的软技能有哪些呢?《软技能——代码之外的生存指南》33岁实现职业自由、财富自由的作者给出了解读。 书的作者也是程序员出身,但书中鲜有的很少涉及代码、架构、管理等内容,而是着重讲解程序员除了编程之外的生存技能,娓娓道来,意犹未尽。 书的观点都很中肯,不论是职业生涯、求...

2018-09-24 08:33:17

阅读数:547

评论数:0

Elasticsearch Top5典型应用场景

题记 刚接触Elasticsearch的朋友,或多或少会遇到一个问题,Elasticsearch在实际公司应用中除了搜索到底能做什么? 本文给出了答案。 除了“You Know, for Search”,Elasticsearch的使用会不断增长和变化。ObjectRocket作为一家托管云...

2018-09-16 19:56:50

阅读数:608

评论数:0

Elasticsearch存储深入详解

在本文中,我们将研究Elasticsearch的各个部分写入数据目录的文件。我们将查看节点,索引和分片级文件,并简要说明其内容,以便了解Elasticsearch写入磁盘的数据。 1、从Elasticsearch路径说起 Elasticsearch配置了多个路径: path.h...

2018-09-09 16:42:56

阅读数:536

评论数:0

干货 | 论Elasticsearch数据建模的重要性

1、什么是数据模型? 数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,用图形化的形式去描述业务规则的过程,从而表示现实世界中事务的相互关系的一种映射。 核心概念: 实体:现实世界中存在的可以相互区分的事务或概念称为实体。 实体可以分为事物实体和概念实体。...

2018-09-01 14:42:02

阅读数:611

评论数:1

思维导图 | Elasticsearch加速检索的15个核心建议

参考 官网地址 小结 优化的文章非常多,但最最核心的还是官方的建议。 适合自己的业务场景的才是最好的,需要结合自己的业务场景反复实践验证,最后“消化吸收”的才是自己的。 脱离了业务场景,一味的追求“奇淫巧技”没有意义! ...

2018-08-26 13:33:52

阅读数:599

评论数:0

干货 | Elasticsearch通用优化建议

1、题记 Elasticsearch开发实战的后期会遇到性能问题,包括:创建索引性能、写入数据性能、检索性能等。网上有很多结合自己实际应用场景的相关优化建议,但“对症下药”才是关键。 实际,官网已经有非常明确的相关优化建议。如果没有实战场景,一些特性的理解可能不到位。为此,我特定将官网建议做了...

2018-08-19 21:26:32

阅读数:652

评论数:0

干货 | Elasticsearch Reindex性能提升10倍+实战

1、reindex的速率极慢,是否有办法改善? 以下问题来自社区:https://elasticsearch.cn/question/3782 问题1:reindex和snapshot的速率极慢,是否有办法改善? reindex和snapshot的速率比用filebeat或者kafka到...

2018-08-11 18:19:21

阅读数:15909

评论数:18

干货 | Elasticsearch索引生命周期管理探索

引言 Elasticsearch上海Meetup中ebay工程师提了索引生命周期管理的概念。的确,在Demo级别的验证阶段我们数据量比较小,不太需要关注索引的生命周期,一个或几个索引基本就能满足需要。所以,这也会产生一种假象,认为:“Elasticsearch不就是增删改查,毛毛雨啦”的荒诞的假...

2018-08-05 16:44:53

阅读数:761

评论数:0

干货 | Elasticsearch集群黄色原因的终极探秘

1、Elasticsearch集群不同颜色代表什么? 绿色——最健康的状态,代表所有的主分片和副本分片都可用; 黄色——所有的主分片可用,但是部分副本分片不可用; 红色——部分主分片不可用。(此时执行查询部分数据仍然可以查到,遇到这种情况,还是赶快解决比较好。 2、Elastics...

2018-07-29 15:20:09

阅读数:1036

评论数:1

干货 | Nginx实现Elasticsearch后台服务的负载均衡

1、题记 Elasticsearch后台程序开发完毕后,相关的ES配置、部署、ES DSL查询、聚合语句也做了优化,但实际客户仍然要求提高QPS,要求保障性能的前提下的很高的并发用户数。 这时候,你能想到的方案是什么呢? 实际调研发现,优选方案是Nginx负载均衡方案。 ...

2018-07-29 13:46:31

阅读数:999

评论数:0

探究 | Elasticsearch不支持事务有什么好的弥补方案吗?

1、问题 源自星球同学的提问:es如何与hive或mysql结合使用?es不支持事务有什么好的弥补方案吗? 2、事务的核心概念 如果一个数据库声称支持事务的操作,那么该数据库必须要具备以下ACID四个特性: 原子性(Atomicity) 原子性是指事务包含的所有操作要么全部成功,要...

2018-07-15 14:38:45

阅读数:1095

评论数:0

探究 | kafka-connector 同步 Elasticsearch速度慢根因分析?

1、kafka同步Elasticsearch的方式 之前博文中也有介绍: 方式一:logstash_input_kafka 方式二:kafka_connector 方式三:spark stream 方式四:java程序读写自己实现 2、kafka-connector同步kafka到E...

2018-07-15 10:25:07

阅读数:611

评论数:0

总结 | Elasticsearch对外提供分词服务实践

1、问题抛出? 实战开发应用场景中,有获取一段话、一篇文章词频的业务场景, 词频的前提就是分词。 常用的中文分词包括: 1、IK分词——https://github.com/medcl/elasticsearch-analysis-ik 2、结巴分词——https://github.co...

2018-07-04 23:57:42

阅读数:624

评论数:2

提示
确定要删除当前文章?
取消 删除