搜索引擎汇总

Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大...

Apache Solr
Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。http://lucene.apache.org/solr/ 

Elastic Search
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。http://www.elasticsearch.com

Index Tank
IndexTank, 一套基于Java的索引-实时全文搜索引擎实现,Includes features like variables (boosts), categories (facets), faceted search, snippeting, custom scoring functions, suggest, and autocomplete。IndexTank的设计分离了相关性标记和文档内容,因为相关性标记的生命周期和文档本身是不一样的,特别是在用户创建的内 容的情况下,例如 分享次数,Like按钮,+1按钮等等。https://github.com/linkedin/indextank-engine

Katta

Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。

Katta可用于大量、重复、索引的碎片,以满足高负荷和巨大的数据集。这些索引可以是不同的类型。当前该实现在LuceneHadoop mapfiles

 http://katta.sourceforge.net/ 

Bobo Search 

bobo-browse 是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能。

比如说搜索电脑,可以得到cpu是intel的有几条命中记录,cpu是amd的有几条命中记录。

 https://github.com/javasoze/bobo 

Compass

Compass是一个强大的,事务的,高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架.Compass包括:  

* 搜索引擎抽象层(使用Lucene搜索引荐),
 * OSEM (Object/Search Engine Mapping) 支持,
 * 事务管理,
 * 类似于Google的简单关键字查询语言, 
 * 可扩展与模块化的框架,
 * 简单的API.

 http://www.compass-project.org/ 

Summa

Summa是一种由java开发的,快速模块化和可扩展的搜索引擎. Summa 有如下特点:

  • 综合搜索. Summa 能够同时访问许多不同的数据和资料来源,并以一个统一的接口公开

  • 模块化设计.Summa 搜索系统由一系列独立模块组成, 这样使得它更简单容易地被维护和升级

  • 可扩展性. Summa 支持分布式架构而且能够按比例的扩大或缩小以处理任何数量的数据

  • 开放标准. Summa 基于现代web技术与标准, 不包含任何私有代码或原理.

  • 故障容错. 如果某单一数据资源或服务出错, Summa 将会继续运行而不受出错部分限制.

http://wiki.statsbiblioteket.dk/summa/ 

Constellio
Constellio 是一个开源的搜索解决方案,适合企业级的搜索。基于 Apache Solr 项目构建,使用 Lucene 做为搜索引擎,并提供基于 Web 的网页和文档的检索。可选择文档类型、文件夹以及文件名进行检索。http://constellio.com/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
各大搜索引擎的搜索语法虽然在细节上可能会有所不同,但它们都提供了一种扩展和精确化搜索结果的方式。这里总结了一些常见的搜索引擎语法: 1. **高级搜索**: - Google: 使用 "site:" 来限定搜索范围(如 "site:example.com"),"intitle:" 和 "inurl:" 来筛选特定关键词出现在标题或URL中的页面。 - Bing: 使用 "site:"、"filetype:" (限制文件类型)、"related:" (找到相关的网页)。 - Yahoo: 类似于Google,使用 "site:", "intext:", "intitle:"。 2. **布尔运算符**: - AND, OR, NOT: 连接、组合和排除关键词。例如:"apple AND phone" 会显示包含“苹果”和“手机”的内容,"cat NOT dog" 排除含有“狗”的结果。 3. **引号包围短语**: - 引号将一组词视为一个整体,精确匹配整个短语。如:“人工智能”。 4. **通配符**: - * (星号): Google 的通配符表示零个或多个字符,如 "*google*" 可以找到 "google", "googledrive", 等。 - Bing: 使用 "?" 替换单个字符,"+" 表示必须存在。 5. **日期范围**: - Google: 使用 "since:" 或 "before:" 指定日期范围。 - Bing: 使用 "date:" 关键字后跟日期或年份范围。 6. **排除搜索**: - Google: 在搜索词前加减号 "-",如 "-spam" 会排除包含 "spam" 的结果。 - Bing: 使用 "!keyword"。 7. **位置搜索**: - Google: "near:" 后接地址查找附近的地方。 - Bing: "定位:"。 8. **知识图谱查询**: - Google: 提供长尾信息如 "定义:人工智能" 或 "谁发明了互联网"。 - Bing: 使用 "wiki:" 命令直接获取维基百科的信息。 了解这些基本语法可以帮助你更有效地利用搜索引擎查找所需信息。不同搜索引擎可能还有其他特性和扩展功能,请根据实际需求查阅各个搜索引擎的帮助文档。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值