此专栏的Elasticsearch学习系列都是些入门基础,只是记录下我学习的历程,期望能帮助一些初学者
ES是什么?
Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。ES是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。
ES的由来
有位老兄在简书科普了,以下内容来源于地址:https://www.jianshu.com/p/3d43616999d9
许多年前,一个叫Shay Banon的待业工程师跟随他的新婚妻子来到伦敦,他的妻子想在伦敦学习做一名厨师。而他在伦敦寻找工作的期间,接触到了Lucene的早期版本,他想为自己的妻子开发一个方便搜索菜谱的应用。
直接使用Lucene构建搜索会有很多的坑以及重复性的工作,所以Shay便在Lucene的基础上不断进行抽象来让Java程序嵌入搜索变得更容易一些,经过一段时间的打磨,就诞生了他的第一个开源作品,他给自己的这个作品起了个名字,叫 “Compass”,中文即“指南针”的意思。
之后,Shay找到了一份新工作,新工作是处在一个高性能分布式的开发环境中。他在工作中渐渐发现,越来越需要一个易用的高性能、实时、分布式搜索服务,于是他决定重写Compass,将它从一个库打造成了一个独立的server,并将其改名为Elasticsearch。
Elasticsearch发布的第一个版本是在2010年的二月份,从那之后,Elasticsearch便成了Github上最受人瞩目的项目之一,并且很快就有超过300名开发者加入进来贡献了自己的代码。后来Shay和另一位合伙人成立了公司专注打造Elasticsearch,他们对Elasticsearch进行了一些商业化的包装和支持。但是,Elasticsearch承诺,永远都将是开源并且免费的。
不过悲剧的是,Shay承诺为妻子开发的菜谱搜索应用,到现在还没做出来……
为什么要用ES?
为了快速搜索,像百度、淘宝那样
场景1:
在淘宝中输入“机械键盘”,如果是sql,我们需要对 商品标题 和 商品描述 字段使用 like %机械键盘%
商品众多,对两个字段同时like,全表扫描想都不敢想
场景2:
商品名称模糊匹配,假如想搜“cherry机械键盘”,但商品名称大多数中间会有型号,如:cherry MX8.0机械键盘
如果是sql,想命中 cherry MX8.0机械键盘,就比较麻烦,product_name like '%cherry%' and product_name like '%机械键盘%'
生产库肯定不能这么搞吧,不然第二天就收拾收拾跑路了
如果是es,就可以通过分词实现,用户输入“cherry机械键盘”,可以搜到图中众多键盘,还带高亮。
这也是我学习Elasticsearch的原因,能解决mysql查询慢的问题,但学习ES的路是坎坷的,快速发展的ES,版本不兼容问题很是头疼,尤其是java集成的时候,为了省事,如果使用spring-data-elasticsearch,也会遇到jar冲突,版本不对各种问题,接下来,就继续踩坑吧,我也建了专栏,会写一些elasticsearch学习的历程,分享给大家,共同成长~
怎么学习ES?
看官方文档
https://www.elastic.co/guide/en/elasticsearch/reference/6.2/getting-started.html
这是6.2.4版本,可以自己选择
中文版(基于es2.0的,有些内容已经过时):https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html