c++搜索引擎库

Apache Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。相当于是 C 语言版的 Lucene


LucenePlusPlus 


(1)CLucene

CLucene是Lucene的一个C++端口,Lucene是一个基于java的高性能的全文搜索引擎。CLucene因为使用C++编写,所以理论上要比lucene快。

项目主页: http://clucene.wiki.sourceforge.net/

(2)Xapian

Xapian是一个用C++编写的全文检索程序,他的作用类似于Java的lucene。尽管在Java世界lucene已经是标准的全文检索程序,但是C/C++世界并没有相应的工具,而Xapian则填补了这个缺憾。

Xapian的api和检索原理和lucene在很多方面都很相似,但是也有一些地方存在不同,具体请看Xapian自己的文档:http://www.xapian.org/docs/

Xapian除了提供原生的C++编程接口之外,还提供了Perl,PHP,Python和Ruby编程接口和相应的类库,所以你可以直接从自己喜欢的脚本编程语言当中使用Xapian进行全文检索了。

  • 项目主页: http://xapian.org/

    (3)DataparkSearch

    DataparkSearch 搜索引擎是一个 C 语言的全功能的开源基于Web的搜索引擎,

    支持来自 http, https, ftp, nntp, and news URLs, htdb virtual URL的数据,内嵌支持数据库、 text/html, text/xml, text/plain, audio/mpeg (MP3), andimage/gif 等格式数据。

    项目主页: http://www.dataparksearch.org/

    (4)PonySE

    PonySE是一个高速的, 灵活的, 小型web搜索引擎, 使用C/C++开发. PonySE的每一个模块都尽量独立,这意味着你可以单独使用其中的一个你觉得有用的模块。

    项目主页: http://gforge.osdn.net.cn/projects/ponyse/

    (5)FirteX

    FirteX 是一个功能强大、高性能、灵活的全文索引和检索平台。 FirteX 的主要目标是研究文本索引的快速构建 (IndexConstruction) ,动态文档集的索引维护 (Index Maintenance) ,短语查询 (PhraseQuery),Top-k 查询的快速处理 (Top-k Query Process) 以及各种检索模型( IR Model)等。高性能和灵活的架构也使 FirteX 可以应用在产品搜索,桌面搜索,站内搜索,新闻搜索, Blog搜索,学术搜索以及大规模搜索引擎等领域中。

  • 项目主页:http://www.firtex.org/

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值