Elasticsearch的优缺点:
优点:
1.Elasticsearch是分布式的。不需要其他组件,分发是实时的,被叫做”Push replication”。
2.Elasticsearch 完全支持 Apache Lucene 的接近实时的搜索。
3.处理多租户(multitenancy)不需要特殊配置,而Solr则需要更多的高级设置。
4.Elasticsearch 采用 Gateway 的概念,使得完备份更加简单。
5.各节点组成对等的网络结构,某些节点出现故障时会自动分配其他节点代替其进行工作。
缺点:
1.只有一名开发者(当前Elasticsearch GitHub组织已经不只如此,已经有了相当活跃的维护者)
2.还不够自动(不适合当前新的Index Warmup API)
Solr的优缺点:
优点
1.Solr有一个更大、更成熟的用户、开发和贡献者社区。
2.支持添加多种格式的索引,如:HTML、PDF、微软 Office 系列软件格式以及 JSON、XML、CSV 等纯文本格式。
3.Solr比较成熟、稳定。
4.不考虑建索引的同时进行搜索,速度更快。
缺点
1.建立索引时,搜索效率下降,实时索引搜索效率不高。
Elasticsearch 与 Solr 的比较:
1.二者安装都很简单;
2.Solr 利用 Zookeeper 进行分布式管理,而 Elasticsearch 自身带有分布式协调管理功能;
3.Solr 支持更多格式的数据,而 Elasticsearch 仅支持json文件格式;
4.Solr 官方提供的功能更多,而 Elasticsearch 本身更注重于核心功能,高级功能多有第三方插件提供;
5.Solr 在传统的搜索应用中表现好于 Elasticsearch,但在处理实时搜索应用时效率明显低于 Elasticsearch。
6.Solr 是传统搜索应用的有力解决方案,但 Elasticsearch 更适用于新兴的实时搜索应用。
solr如何实现搜索的?
倒排索引,先抽取文档中词,并建立词与文档id的映射关系,然后查询的时候会根据词去查询文档id,并查询出文档
Solr过滤器
Solr的过滤器对接收到的标记流(TokenStream )做额外的处理
过滤查询,在查询时设置