solr入门教程(solr8,linux)

一.下载
地址:https://lucene.apache.org/solr/downloads.html
下载binary releases,我这里下载了比较新的solr-8.11.0。

二.使用默认容器jetty安装
(1)进入solr-8.11.0/bin,修改solr.in.sh,SOLR_ULIMIT_CHECKS=false
(2)./solr start -p 8983 -force
(3)登录http://192.168.124.128:8983/solr

三.创建core
在网页左下角点击Core Admin-Add Core(如name设置成my_core)-add Core:
此时会弹出在my_core目录下缺少solrconfig.xml,将含有此配置文件的文件夹(solr8是solr-8.11.0/server/solr/configsets/_default的conf文件夹)放入该目录下即可。若创建成功,可以看到solr-8.11.0/server/solr生成了目录my_core。

四.配置分词器
(1)下载中文分词器ik-analyzer(gitee/github,注意版本)https://gitee.com/xuquanch_9895/ik-analyzer-solr?_from=gitee_search,查看使用说明,上面有jar包下载和单机版solr的使用说明
(2)jar包放入/server/solr-webapp/webapp/WEB-INF/lib
(3)在server/solr/my_core/conf的managed-schema中添加如下代码

	<!-- ik分词器 -->
	<fieldType name="text_ik" class="solr.TextField">
		<analyzer type="index">
			<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
			<filter class="solr.LowerCaseFilterFactory"/>
		</analyzer>
		<analyzer type="query">
			<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
			<filter class="solr.LowerCaseFilterFactory"/>
		</analyzer>
	</fieldType>

(4)重启./solr restart -p 8983 -force
(5)再次登录,左下角的Core Selector选择my_core -> Analysis -> Field Value (Index)输入 “来不及说再见”;选择分词器Fieldname / FieldType: text_ik
,点击Analyse Values,分词后显示如下。
在这里插入图片描述
五.连接数据库
这里我用的是mysql,mysql的安装可参考:https://blog.csdn.net/tttalk/article/details/121929642
(1)建立数据库,创建表,建立索引。
CREATE TABLE celebrity (
id int(8) NOT NULL AUTO_INCREMENT,
name varchar(50) DEFAULT NULL COMMENT ‘姓名’,
description varchar(500) DEFAULT NULL COMMENT ‘简介’,
PRIMARY KEY (id)
);
insert into celebrity(name,description) values(‘神九根’,‘国家一级书画家’);
insert into celebrity(name,description) values(‘翟全刚’,‘心无旁骛的创作者’);
insert into celebrity(name,description) values(‘潘昭亮’,‘雕刻名家’);
insert into celebrity(name,description) values(‘夏国祥’,’“盛世中国”书画界最’);
insert into celebrity(name,description) values(‘陈鸣楼’,’《南宋皇城图》创作说明’);
insert into celebrity(name,description) values(‘张祥伟’,‘玉雕艺术乃是毕生追求’);
(2)将solr-8.11.0\dist下的两个jar:solr-dataimporthandler-8.2.0.jar 和 solr-dataimporthandler-extras-8.2.0.jar和数据库驱动包放入server/solr-webapp/webapp/WEB-INF/lib。
mysql8驱动包(mysql-connector-java-8.0.15.jar)下载路径:①https://dev.mysql.com/downloads/file/?id=484819,下载完记得解压,
②参考上面那个mysql安装的文章,成功连接后,使用maven中下载的jar包
(3)配置需要分词的查询方法,数据库连接等
①在solr\my_core\conf中新建文件data-config.xml

<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
    <!-- 数据库信息 -->
    <dataSource type="JdbcDataSource" 
        driver="com.mysql.jdbc.Driver" 
        url="jdbc:mysql://192.168.124.128:3306/mysql?characterEncoding=utf-8" 
        user="root" password="Ppp11111111!" encoding="UTF-8"/>
    <document>
         <entity name="celebrity" pk="id" query="select * from celebrity ">
            <!-- 对应数据库表的字段 -->
            <field column="id" name="id" />
            <field column="name" name="name" />
            <field column="description" name="description" />
        </entity>
    </document>
</dataConfig>
②将刚刚的配置data-config.xml配置到同目录的solrconfig.xml中,搜索Request Handlers,放在其下面
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> 
	<lst name="defaults"> 
	  <str name="config">data-config.xml</str> 
	</lst> 
</requestHandler>	

③配置managed-schema,其中type="text_ik"为第四步中测试过的分词器,找到

<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />

将下面两行放在该代码下,如果不配置这两行数据,则查询结果只会展示id和version。

<field name="name" type="text_ik" indexed="true" stored="true" multiValued="true" />
<field name="description" type="text_ik" indexed="true" stored="true" multiValued="true" />

(4)重启后再次登录,左下角的Core Selector选择my_core-Dataimport-full import,勾选clean/commit,Entity选择celebrity,点击Execute以及Refresh Status,
可以看到Added/Updated: 6 documents. Deleted 0 documents.说明表中的6条数据都已经导进去了
在这里插入图片描述
然后选择Dataimport下面的query,点击Execute Query,能看到6条数据。
在这里插入图片描述
(5)query界面参数详细解释
qt :(query type)指定那个类型来处理查询请求,一般不用指定,默认是standard;
q : 查询的关键字,此参数最为重要,如输入 name:神九根 则会查询name='神九根’的数据;
fq :(filter query)过虑查询,提供一个可选的筛选器查询。返回在q查询符合结果中同时符合的fq条件的查询结果,例如:q=id:1&fq=sort:[1 TO 5],找关键字id为1 的,并且sort是1到5之间的;
sort : 排序方式,例如id desc 表示按照 “id” 降序;
rows :指定返回结果最多有多少条记录,默认值为 10,配合start实现分页;
fl : 指定返回哪些字段,用逗号或空格分隔,注意:字段区分大小写,例如,fl= id,name,默认返回数据配置文件中file的字段;
df 默认的查询字段,一般默认指定。
wt:返回类型,有json、XML等;
hl:高亮显示;
facet:分组,其中facet.query表示所有的索引中含有该内容的数据有多少条,facet.field和facet.prefix需要结合,表示字段facet.field含有facet.prefix的内容共有多少条;

(6)如果报错,可以参考日志:solr-8.11.0/server/logs/solr.log

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Spring4GWT GWT Spring 使得在 Spring 框架下构造 GWT 应用变得很简单,提供一个易于理解的依赖注入和RPC机制。 Java扫雷游戏 JVMine JVMine用Applets开发的扫雷游戏,可在线玩。 public class JVMine extends java.applet.Applet 简单实现!~ 网页表格组件 GWT Advanced Table GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对业务代码零侵入 2. 支持使用Redis和Memcached作为后端缓存。3. 支持缓存数据分区规则的定义 4. 使用redis作缓存时,支持list类型的高级数据结构,更适合论坛帖子列表这种类型的数据 5. 支持混合使用redis缓存和memcached缓存。可以将列表数据缓存到redis中,其他kv结构数据继续缓存到memcached 6. 支持redis的主从集群,可以做读写分离。缓存读取自redis的slave节点,写入到redis的master节点。 Java对象的SQL接口 JoSQL JoSQL(SQLforJavaObjects)为Java开发者提供运用SQL语句来操作Java对象集的能力.利用JoSQL可以像操作数据库中的数据一样对任何Java对象集进行查询,排序,分组。 搜索自动提示 Autotips AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的PList类库 Blister Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端 JOpenID JOpenID是一个轻量级的OpenID 2.0 Java客户端,仅50KB+(含源代码),允许任何Web网站通过OpenID支持用户直接登录而无需注册,例如Google Account或Yahoo Account。 JActor的文件持久化组件 JFile JFile 是 JActor 的文件持久化组件,以及一个高吞吐量的可靠事务日志组件。 Google地图JSP标签库 利用Google:maps JSP标签库就能够在你的Web站点上实现GoogleMaps的所有功能而且不需要javascript或AJAX编程。它还能够与JSTL相结合生成数据库驱动的动态Maps。 OAuth 实现框架 Agorava Agorava 是一个实现了 OAuth 1.0a 和 OAuth 2.0 的框架,提供了简单的方式通过社交媒体进行身份认证的功能。 Eclipse的JavaScript插件 JSEditor JSEditor 是 Eclipse 下编辑 JavaScript 源码的插件,提供语法高亮以及一些通用的面向对象方法。 Java数据库连接池 BoneCP BoneCP 是一个高性能的开源java数据库连接池实现库。它的设计初衷就是为了提高数据库连接池的性能,根据某些测试数据发现,BoneCP是最快的连接池。BoneCP很小,只有四十几K

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值