博客专栏  >  云计算/大数据   >  搜索引擎

搜索引擎

Lucene学习笔记

关注
6 已关注
123篇博文
  • 搭建好solr,启动tomcat,报错Error loading class "solr.VelocityResponseWriter"

    搭建好solr,启动tomcat,报错Error loading class "solr.VelocityResponseWriter"

    2016-03-24 08:33
    655
  • Solr 4.7.2 平台搭建(Solr发布到Tomcat6的详细配置)

    Solr 4.7.2 平台搭建(Solr发布到Tomcat6的详细配置)

    2016-03-07 16:01
    1770
  • Heritrix安装和配置

    实话说我对于这东西是又爱又恨,整了我很久很久。都把电脑整的重装了,才好。 对于爬虫来说自己试过nutch,这个也是第一次弄,还好,没有辜负我。  下面讲一下: 首先需要注意的是两个东西,...

    2014-11-30 18:05
    776
  • solr简单介绍

    Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Ge...

    2015-04-19 17:05
    492
  • Lucene对office的word, Excel操作

    首先说明Lucene如果想对office进行操作的话,需要额外的包 这里有几种方法 一是使用POI 二是使用jacob 这里的代码使用的是jacob对于word进行处理 代码...

    2015-04-05 16:41
    915
  • 利用Lucene和 XPDF 来处理pdf文件

    /*  * 利用Lucene和 XPDF 来处理pdf文件  * */ package pdfbox; import java.io.File; import java.io.IOE...

    2015-04-05 16:39
    680
  • 利用lucene和pdfBox对PDF文本进行内容的解析

    /*  * 这段代码的功能是利用PDFBox.zip的包  * 利用lucene对PDF文本进行内容的解析  * 读取pdf文件的内容。然后重新的写入到同名的.txt文件中  * */ 结果...

    2015-04-05 10:11
    1240
  • JE分词器

    /*这段代码写的是JE分词器对于所输入的文本进行分词 * 这里还可以自己设定,分词的范围和单个词语,这样用户可以更加方便对想要 *处理的文本更加的灵活多变。 *这里我添加的例子是.addWord(“...

    2015-04-04 10:58
    807
  • WhitespaceAnalyzer方法的使用

    对于这个分词器,我的有一篇博客写了大概的简介(对于像我一样的新手,最好看一下),自由门: http://blog.csdn.net/u012965373/article/details/44...

    2015-04-04 09:39
    1200
  • Lucene内置的Analyzer分词器

    Lucene分词器

    2015-04-04 09:33
    1691
  • 在结果中查询二次过滤QuueryFilter

    /*  *在结果中查询二次过滤QuueryFilter  *可以按照上下文所规定的范围进行对文本的过滤  */ 结果图: package filter; imp...

    2015-04-03 16:40
    551
  • 按照范围过滤所使用的类是Lucene的RangeFilter

    /*  * 按照范围过滤所使用的类是Lucene的RangeFilter  * 可以按照上下文所规定的范围进行对文本的过滤  * */ package filter; import ...

    2015-04-03 16:23
    504
  • 一个简单的Filter:安全级别与过滤器

    /*  * 一个简单的Filter:安全级别与过滤器  *这个代码的功能是使用Lucene的Filter对于规定级别的文档  *进行过滤,不予显示  *这里级别为0的就将被过滤掉  * */ pack...

    2015-04-03 15:28
    512
  • lucene的Filter简单用法打印索引文档信息

    /*  * Filter这个类的功能是实现对于查询的过滤器,  * 对于用户搜索的,可以把保密的网站或者文档对用户不进行显示  * 例如:  * 这里就是一个图书馆的查询系统,图书馆的有些珍贵资料是不...

    2015-04-03 11:35
    835
  • Lucene使用SortField对多个字段进行排序

    /*  * 这里的类实现的功能是对多个字段进行排序  * 比单个难度要大,但是有相应的方法,可以满足不同项目的不同需求  * */ package score; import jav...

    2015-04-03 10:36
    2278
  • Lucene使用Sort方法对文档进行排序

    /*  * 这段代码使用的是Lucene对于文档排序使用的sort方法  * 这里可以使用多个sort的构造方法,来自己定义,所想要实现的功能。  * */ package score; ...

    2015-04-03 09:45
    660
  • 使用Lucene通过改变boost的值来改变文档的得分

    /*  * 通过改变boost的值来改变文档的得分  * 在这个例子中Doc3的得分是最少的,  * 加入我想把doc3的得分变高,把他放到网页的第一条,  * 那么就是用doc3.setBo...

    2015-04-03 09:05
    827
  • Lucene中使用Score进行自然排序

    Lucene中使用Score进行自然排序

    2015-04-03 08:48
    1013
  • RegexQuery正则搜索

    RegexQuery正则搜索

    2015-03-31 19:51
    649
  • WildCardQuery通配符查找

    通配符查找

    2015-03-31 19:26
    648
img博客搬家
img撰写博客
img专家申请
img意见反馈
img返回顶部