Compass项目是基于Lucene的一个开源项目,其主旨在于简化将搜索集成到Java应用的过程。最近,该项目发布了2.0版本。InfoQ就此采访了Compass的创始人Shay Banon以获得关于该版本更多更详尽的信息,并且对Compass为Java社区所做的贡献进行了一番深入的了解。
Banon罗列了该版本最主要的几个特性在于:
- 简化O/R映射(ORM)的集成——所有集成特性,比如实时将ORM的变化在搜索索引上生成镜像和完成基于映射(mapping-based)的数据库索等特性,现在可以通过Hibernate/JPA的配置文件中的配置属性得以实现。
- 分布式数据网格的集成——该版本目前可以支持与GigaSpaces、Terracotta和Coherence的集成,用于实现Lucene索引存储的方法现在被作为数据网格的一部分。此外,通过Lucene类库和工具仍然能够透明地使用Lucene索引。
- 可搜索数据网格功能——在数据网格上发生的变化会通过对象到搜索引擎的映射(Object to Search Engine mapping)以及与Coherence CacheStore、GigaSpaces镜像服务的集成自动在Lucene索引上生成镜像。
- 性能优化——Compass内部的主要强化和Lucene 2.3中的优化直接催化了Compass性能的提升。
- Compass 1.2升级简易——主要的API仍然保持不变,有所更改的是一些配置和微小的API方面的修改,相关的升级文档(upgrade notes)覆盖了这些变化。由于一些内部修改,导致应用需要重新创建索引(reindex),但总体来说,升级过程相当简单。
另外,Compass新建了一个项目官方网站:http://www.compass-project.org,在这个网站上,你可以检索到该版本完整的修改列表。
Banon还描述了Compass的核心特性,以及如何将Compass与Solr、Nutch和基础Lucene进行对比:
Compass的核心目标在于将搜索集成到Java应用的过程进行简化。Compass试图在结合搜索引擎工作的时候简化API。对于习惯了ORM类库的开发人员来说,这些API应该非常熟悉。Compass的另一主要特性是,它能够轻松地将Java对象模型映射到搜索引擎中,也能够映射另外一些格式,比如像XML和Map类似的结构。更重要的是,Compass不仅仅能轻松地映射数据,还能提供应用与ORM类库、数据网格等天衣无缝的集成。
关于Lucene,Compass创建于Lucene之上。通过Compass,你可以得到Lucene所有的特性,但Compass试图简化其用法,尤其是在一些典型的Java应用中。至于Solr,我猜想它的目标也是为了简化Lucene,但它采用的方法和Compass不同,它将暴露了一个http服务用来进行索引和搜索,但是我也听说它的一个“嵌入式”版本也将公布于世。我想最主要的不同点是两者对于如何将搜索集成到应用程序中持有不同的看法。我只想指出的是,在Compass上创建一个http服务非常简单,已经有很多用户在Compass上创建了http服务。
当被问到Compass的未来计划的时候,Banon表示Compass大部分特性都是由用户需求驱动开发的。潜在的未来动向包括面向一些不同的索引格式(比如JSON);提供更全面、更多特性的数据网格集成来实现托管的索引和搜索(colocated indexing and searching);以及提供一个UI层的搜索集成来创造更好的开箱即用体验。Banon表示他非常欢迎和期待关于Compass的各种反馈和帮助。