随着互联网行业的发展,搜索引擎已经深入到各行各业,已经是众多内容平台必不可少的功能。在实际业务中,当搜索的速度,性能和高可用性是核心要求时,对TB和PB的数据执行搜索可能会遇到挑战,此时就需要用到分布式全文检索。了解过搜索引擎的应该清楚,目前最热门的两款开源的搜索引擎,Solr和Elasticsearch都是非常不错的选择,但这两者应该如何选?是搜索新手面临的第一大问题。
它们都基于Apache Lucene构建,因此它们支持的功能非常相似。但是,它们在部署,可伸缩性,查询语言和许多其他功能方面有很大不同。本文就来比较比较这两款非常强大的搜索引擎。
关于Apache Solr
Apache Solr是建立在Lucene之上的开源搜索服务器,它通过HTTP请求提供Lucene的所有搜索功能。它已经存在了近十五年,使其成为具有广泛用户社区的成熟产品。Solr提供了强大的功能,例如分布式全文本搜索,近实时索引,高可用性,NoSQL功能,与诸如Hadoop的大数据工具集成以及处理诸如Word和PDF之类的富文本文档的功能。