最近有幸研究到了这块领域的内容,而我本人也对于这块非常的感兴趣,所以打算写一篇文章记录一下…
简介
Lucene
Lucene是 apache 软件基金会某个项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。顺便提一下,Lucene最初是由Doug Cutting开发的,没错,就是那个创造了大数据Hadoop的那个男人。
Elasticsearch
Elasticsearch是一个基于Apache Lucene 的开源实时分布式搜索和分析引擎。它让用前所未有的速度处理大数据成为可能。
它用于全文搜索、结构化搜索、分析以及将这三者混合使用,下面列出一些典型的使用案例:
- GitHub 使用 Elasticsearch 搜索 20TB 的数据,包含 13亿 的文件 和 1300 亿行的代码。
- 德国 SoundCloud 使用 Elasticsearch 来为 1.8 亿 用户提供即时精准的音乐搜索服务。
- Sony 公司使用 elasticsearch 作为