solr基本概况
Solr是一个独立的企业级搜索应用服务器,Solr采用Java语言开发,主要基于HTTP和Apache Lucene实现。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引,也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。
Solr具有高性能的特点,主要功能包括全文检索、命中标示、分面搜索、动态聚类、数据集成,以及富文本的处理。同时Solr是高度可扩展的,并提工了分布式搜索和索引复制。Solr是运行在Servlet容器的一个独立的全文搜索服务器,采用了 Lucene Java搜索库为核心的全文索引和搜索,并具有类似REST的HTTP/XML和JSon的API。
Solr历史
2004年 CNET 开发 Solar,为 CNET 提供站内搜索服务。
2006年1月捐献给 Apache ,成为 Apache 的孵化项目。
一年后 Solr 孵化成熟,发布了1.2版,并成为 Lucene 的子项目。
2010年6月,solr 发布了的1.4.1版,这是1.4的 bugfix 版本,1.4.1的solr使用的lucene是2.9版本的。
solr 从1.4.x版本以后,为了保持和lucene同步的版本,solr直接进入3.0版本。
Solr特性
Solr的优点:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。
Solr的缺点:建立索引时,搜索效率下降,实时索引搜索效率不高。