- 博客(13)
- 资源 (21)
- 收藏
- 关注
转载 Solr or Lucene全文检索实现原理
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML/Json格式的返回结果。采用Java5开发,基于Lucene。 Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文
2017-06-19 11:19:41 18511 2
原创 Solr分词mmseg4j配置
1 概述中文分词器有多中,常用的有 IKAnalyzer、 mmseg4j。引用:前者最新版本更新到2012年,所以使用的时候要注意可能版本上有不兼容的情况,由于它是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分
2017-06-19 10:42:19 15475 3
原创 Maven经典错误之三:was cached in the local repository, resolution will not be reattempted until the upda
常见错误:Multiple annotations found at this line:- No plugin found for prefix 'war' in the current project and in the plugin groups [] available from the repositories [local (D:\Maven_3\maven\m2\repos
2017-06-19 10:33:44 80293 3
原创 Java System参数获取
备注: 在Java中通过调用System.getProperty("line.separator")获得一些系统的环境变量或者参数,整理如下:
2017-06-14 15:09:38 760
转载 Solr搜索引擎原理
本文转载至:http://www.importnew.com/12707.html场景:小时候我们都使用过新华字典,妈妈叫你翻开第38页,找到“坑爹”所在的位置,此时你会怎么查呢?毫无疑问,你的眼睛会从38页的第一个字开始从头至尾地扫描,直到找到“坑爹”二字为止。这种搜索方法叫做顺序扫描法。对于少量的数据,使用顺序扫描是够用的。但是妈妈叫你查出坑爹的“坑”字在哪一页时,你要是从第一页的第一
2017-06-14 15:03:22 15484
原创 solr分页查询
分页查询:package com.solorj.solrj_test;import java.io.IOException;import org.apache.solr.client.solrj.SolrQuery;import org.apache.solr.client.solrj.SolrServerException;import org.apache.solr.c
2017-06-14 14:59:26 18586
原创 solr导入xml文件
1 概述大多数的应用程序将数据存储在关系数据库、xml文件中。对这样的数据进行搜索是很常见的应用。所谓的DataImportHandler提供一种可配置 的方式向solr导入数据,可以一次全部导入,也可以增量导入。 能够读取关系数据库中的数据。 通过可配置的方式,能够将数据库中多列、多表的数据生成solr文档 能够通过solr文档更新solr
2017-06-14 14:55:55 16041
原创 solr导入csv文件
1 概述大多数的应用程序将数据存储在关系数据库、xml文件中。对这样的数据进行搜索是很常见的应用。所谓的DataImportHandler提供一种可配置 的方式向solr导入数据,可以一次全部导入,也可以增量导入。 能够读取关系数据库中的数据。 通过可配置的方式,能够将数据库中多列、多表的数据生成solr文档 能够通过solr文档更新solr 提供 通
2017-06-14 14:50:23 17927
原创 solr导入MySql数据
1 概述大多数的应用程序将数据存储在关系数据库、xml文件中。对这样的数据进行搜索是很常见的应用。所谓的DataImportHandler提供一种可配置 的方式向solr导入数据,可以一次全部导入,也可以增量导入。 能够读取关系数据库中的数据。 通过可配置的方式,能够将数据库中多列、多表的数据生成solr文档 能够通过solr文档更新solr
2017-06-14 14:44:58 21647 2
原创 solr版本升级说明
1 概述Solr5发布了,带来了许多新特性,但Solrj的许多接口也发生了变化,下面是和之前的版本进行的一些对比:变化1:SolrServer变成了SolrClient应该说这个变化是合理的,毕竟Solrj就是一个客户端,命名为Server本身就有问题。这样一来,所有SolrServer系列的类都需要更改为SolrClient系列的类,好在方法基本继承过来了,只需要修改一下类名就可以
2017-06-14 14:35:46 17929
原创 solr Java测试
1 概述Solr 是一个独立的企业级搜索应用服务器,它对外提供类似于 Web-service 的 API 接口。用户可以通过 http请求,向搜索引擎服务器提交一定格式的 XML 文件,生成索引;也可以通过 Http Get 操作提出查找请求,并得到XML 格式的返回结果。这里主要讲解下通过 http Get 请求这种方式。首先,我们就必须通过 HTTP 请求类似http://local
2017-06-14 14:28:55 14273
原创 Solr配置文件详解
1 概述Solr配置文件位于solr/conf目录下,因各个版本的solr目录不太一致,所以下面以solr5.x或者以上版本来说明相关配置文件的参数及一些相关作用。 2 目录结构说明 官网下载solr之后解压:目录说明:bin:Solr控制台管理工具存在该目录下。如:solr.cmd等。contrib:该文件包含大量关于Solr的扩展。分别如下:
2017-06-14 14:20:01 32661 2
原创 Solr安装配置
1 概述Apache Solr是一个功能强大的搜索服务器,它支持REST风格API。Solr是基于Lucene的,Lucene 支持强大的匹配能力,如短语,通配符,连接,分组和更多不同的数据类型。它使用 Apache Zookeeper特别针对高流量进行优化。Apache Solr支持不同格式,包括各种数据库,PDF文件,XML文件,CSV文件等等。 Apache Solr提供各式各样的功能,我
2017-06-14 14:07:12 16502 3
elasticsearch-7.2.0-linux-x86_64.tar.gz
2020-05-06
kafkatool_64bit.rar
2020-05-06
磁盘文件大小统计.zip
2020-05-06
GraphicsMagick-1.3.12-Q16-windows-dll.exe
2020-05-06
IntelliJ IDEA常用配置操作文档
2019-05-31
Linux Nginx1.1.1安装包及依赖包
2018-11-24
hadoop的winutils.exe及dll文件
2018-07-04
dubbo war 2.5.4下载
2017-08-01
solr-dataimport-scheduler.jar定时同步
2017-07-07
YUI compressor右键压缩脚本
2017-04-01
Eclipse/MyEclipse汉化版SVN插件
2012-12-19
PowerDesigner(CDM—PDM—SQL脚本的转换流程
2012-01-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人