少点代码,多点头发
本文已经被GitHub收录,欢迎大家踊跃star 和 issues。
https://github.com/midou-tech/articles
说点废话
前面写了Es开篇简介,别管原理,先run起来 两篇关于Es的文章,反响还不错,有读者也在催接下来的更新进度。
在一个400人的大群里,直接催我更新,只能说压力山大啊…
其实还好,催更说明两个问题
- 文章有被大家看到
- 文章确实有点东西
最近刚进入新的工作环境,需要去了解新的工作内容、了解需求、了解工程架构,工作上的事情比较多。
Elasticsearch系列我也是边学边写,很多不确定知识点需要去查大量的资料。
来点正文
既然是学习,就必须给自己制定一个好的学习路线,把自己要掌握的知识梳理下来,后期学习也不会迷失方向。
加之前面说了要写这一系列的文章,也没有个具体大纲,忍不住吐槽自己一把。
花了一些时间总结了关于Elasticsearch的整体知识框架,也是之后更新的写作框架。
看不清楚的可以后台回复【ES脑图】获取高清pdf文件。
这个脑图,不简单是一个写作路线图,也是一个很好的学习路线图,同时也是一个es整体知识框架图。
为什么要学ES
ES的发展史
竞争优势
使用场景
基本概念
索引(Index)
文档(Document)
映射(mapping)
集群(cluster)
分片(shard)
先用起来(使用者)
本地搭建安装Es集群/服务端搭建集群
写入数据进Es
- 爬虫系统爬取互联网数据
- filebeat采集数据
- 监听binlog
- 上报数据系统
Es简单查询语法
重要配置讲解
数据处理
基本的数据操作
-
CRUD
- filebeat/client/http
-
文档的Bulk操作
-
文档的并发操作
数据建模
- 索引建模
- 文档建模
- mappings&settings
数据修复
- 通过pipeline预处理
- query更新数据
- 重建索引
文本数据分析
- Analyzer
- Tokenizer
索引管理
搜索姿势
搜索API
结构化查询
全文检索
join查询
符合查询
地理位置检索
搜索结果处理
相关性干预
讲讲原理
核心概念
- 索引
- 文档
- 映射
- 分片
- 副本
- 节点
- 集群
- 路由
倒排索引
-
分词
- 内置分词器
- 多语言分词器
-
倒排结构探析
搜索相关性
-
相关性算法
- TF-IDF/BM25
- 向量空间模型、余弦定理
-
相关度指标
插件开发
API扩展
分词插件
安全插件
业务逻辑插件
分布式支持
分布式索引原理
分布式路由
分片原理
节点故障转移
分布式搜索流程
Es管理
集群部署与水平扩展
集群备份与升级
集群安全
集群监控
集群问题诊断与排查
架构设计
ES架构设计图分析
项目实战
知名博主博文检索系统
- 优选一批优秀原创作者,三太子敖丙、java3y、接水怪等等
- 博文检索,标题、正文、内容、作者、内容标签
- 热点排序
业界通用ELK实战
接下来的几篇会写关于一个使用者,如何用好Elasticsearch,用一些常见的示例去写这部分的文章。
例如,大量日志数据怎样写进es?写进去之后如何建索引?怎么查询我想要的数据?
会围绕这一系列去写,先用好Elasticsearch之后,再去探索他的原理。