【linux 开发】8 个基于 Lucene 的开源搜索引擎

最新推荐文章于 2024-03-11 21:30:51 发布

Walter_Jia

最新推荐文章于 2024-03-11 21:30:51 发布

阅读量1.6k

点赞数

分类专栏： Linux Develop

本文链接：https://blog.csdn.net/jiayanhui2877/article/details/43986709

版权

博客内容介绍了8个基于Lucene的开源搜索引擎，包括Apache Solr、Elasticsearch、IndexTank、Katta、Bobo Search、Compass、Summa和Constellio，详细阐述了它们的特点和应用场景。

摘要由CSDN通过智能技术生成

自行下载安装了Solr安装运行并建立索引后，可以通过curl或自带的控制台程序进行文本搜索，使用curl搜索结果如下，可以看到我们的quikstart.html文档中包含features词，利用此服务器我们可以开发自己的文本搜索系统，首先用solr为文本建立索引，然后自行开发客户端向solr发送url，从而获取返回的json信息用于展示，实现搜索功能。

[root@localhost docs]# curl "http://localhost:8983/solr/gettingstarted/select?q=*features*&wt=json&indent=true"
{
"responseHeader":{
    "status":0,
    "QTime":55,
    "params":{
      "indent":"true",
      "q":"*features*",
      "wt":"json"}},
"response":{"numFound":26,"start":0,"maxScore":1.0,"docs":[
      {
        "id":"/home/solr/solr-5.0.0/docs/quickstart.html",
        "title":["Solr Quick Start"],
        "stream_content_type":["text/html"],
        "stream_size":[32319],
        "content_encoding":["UTF-8"],
        "x_parsed_by":["org.apache.tika.parser.DefaultParser",
          "org.apache.tika.parser.html.HtmlParser"],
        "content_type":["text/html; charset=UTF-8"],
        "resourcename":["/home/solr/solr-5.0.0/docs/quickstart.html"],
        "dc_title":["Solr Quick Start"],
        "_version_":1492164945436999680},

Lucene是一种功能强大且被广泛使用的搜索引擎，以下列出8种基于Lucene的搜索引擎，你可以想象他们有多么强大...

Apache Solr
Solr是一个高性能，采用Java5开发，基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括：高效、灵活的缓存功能，垂直搜索功能，高亮显示搜索结果，通过索引复制来提高可用性，提供一套强大Data Schema来定义字段，类型和设置文本分析，提供基于Web的管理界面等。http://lucene.apache.org/solr/