Solr的使用

最新推荐文章于 2024-06-25 10:33:00 发布

Mr小林

最新推荐文章于 2024-06-25 10:33:00 发布

阅读量2.4k

点赞数 1

分类专栏： ------【solr】 ●架构设计

本文链接：https://blog.csdn.net/mrlin6688/article/details/54134704

版权

●架构设计同时被 2 个专栏收录

31 篇文章 1 订阅

订阅专栏

------【solr】

4 篇文章 0 订阅

订阅专栏

1、 schema.xml

schema.xml文件在SolrCore的conf目录下，在此配置文件中定义了域以及域的类型等一些配置。在solr中域必须先定义后使用。

1.1filed

Name：域的名称

Type：域的类型

Indexed：是否索引

Stored：是否存储

Required：是否必须

multiValued：是否是多值，存储多个值时设置为true，solr允许一个Field存储多个值，比如存储一个用户的好友id（多个），商品的图片（多个，大图和小图）

1.2 dynamicField（动态域）

<dynamicFieldname="*_s" type="string" indexed="true" stored="true" />

Name：动态域的名称，是一个表达式，*匹配任意字符，只要域的名称和表达式的规则能够匹配就可以使用。

例如：搜索时查询条件[product_i：钻石]就可以匹配这个动态域，可以直接使用，不用单独再定义一个product_i域。

1.3uniqueKey

相当于主键，每个文档中必须有一个id域。

1.4copyField(复制域)

可以将多个Field复制到一个Field中，以便进行统一的检索。当创建索引时，solr服务器会自动的将源域的内容复制到目标域中。

source：源域

dest：目标域，搜索时，指定目标域为默认搜索域，可以提高查询效率。

定义目标域：

目标域必须要使用：multiValued="true"

1.5fieldType(域类型)

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
  <analyzer type="index">
	<tokenizer class="solr.StandardTokenizerFactory"/>
	<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
	<filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>	
  <analyzer type="query">
	<tokenizer class="solr.StandardTokenizerFactory"/>
	<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
	<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
	<filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

name：域类型的名称

class：指定域类型的solr类型。

analyzer：指定分词器。在FieldType定义的时候最重要的就是定义这个类型的数据在建立索引和进行查询的时候要使用的分析器analyzer，包括分词和过滤。

type：index和query。Index 是创建索引，query是查询索引。

tokenizer：指定分词器

filter：指定过滤器

2、配置中文分词器

使用IKAnalyzer中文分析器

第一步：把IKAnalyzer2012FF_u1.jar添加到solr/WEB-INF/lib目录下。

第二步：复制IKAnalyzer（IK Analyzer 2012FF_hf1）的配置文件（IKAnalyzer.cfg.xml）和自定义词典(ext.dic)和停用词词典(stopword.dic)到solr的solr/WEB-INF/classes目录下。

复制IK分词器配置文件、自定义词典、停用词词典

粘贴到Tomcat的solr的/WEB-INF/classes目录下

第三步：在schema.xml中添加一个自定义的fieldType，使用中文分析器。

<!-- IKAnalyzer-->
    <fieldType name="text_ik" class="solr.TextField">
      <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>

第四步：在schema.xml中添加field，指定field的type属性为text_ik

<!--IKAnalyzer Field-->
<field name="content_ik" type="text_ik" indexed="true" stored="true" />

第五步：重启tomcat

http://localhost:8080/solr

3、配置业务Field

要使用solr实现网站中商品搜索，需要将mysql数据库中数据在solr中创建索引。

第二步. 需要在solr的schema.xml文件定义要存储的商品Field。

第一步.. 需要把MySQL的数据导入到solr索引库中

第三步.. 开发搜索功能

3.1将数据导入到数据库

3.2定义Field

先确定定义的商品document的Field域有哪些？

可以根据mysql数据库中商品表的字段来确定：

3.3Schema.xml中配置业务域

<!--product-->
<field name="product_name" type="text_ik" indexed="true" stored="true"/>
<field name="product_price"  type="float" indexed="true" stored="true"/>
<field name="product_description" type="text_ik" indexed="true" stored="false" />
<field name="product_picture" type="string" indexed="false" stored="true" />
<field name="product_catalog_name" type="string" indexed="true" stored="true" />

<field name="product_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>
<copyField source="product_name" dest="product_keywords"/>
<copyField source="product_description" dest="product_keywords"/>

3.4dataimportHandler插件

使用dataimport插件批量导入数据。

第一步：把dataimport插件依赖的jar包(solr-4.10.3\dist下的solr-dataimporthandler-4.10.3.jar和solr-dataimporthandler-extras-4.10.3.jar)添加到solrcore（collection1\lib）中, 还需要mysql的数据库驱动。

第二步：配置solrconfig.mxl文件，添加一个requestHandler。

 <requestHandler name="/dataimport" 
class="org.apache.solr.handler.dataimport.DataImportHandler">
    <lst name="defaults">
      <str name="config">data-config.xml</str>
     </lst>
 </requestHandler>

第三步：创建一个data-config.xml，保存到collection1\conf\目录下

<?xml version="1.0" encoding="UTF-8" ?>  
<dataConfig>   
<dataSource type="JdbcDataSource"   
		  driver="com.mysql.jdbc.Driver"   
		  url="jdbc:mysql://localhost:3306/lucene"   
		  user="root"   
		  password="root"/>   
<document>   
	<entity name="product" query="SELECT pid,name,catalog_name,price,description,picture FROM products ">
		 <field column="pid" name="id"/> 
		 <field column="name" name="product_name"/> 
		 <field column="catalog_name" name="product_catalog_name"/> 
		 <field column="price" name="product_price"/> 
		 <field column="description" name="product_description"/> 
		 <field column="picture" name="product_picture"/> 
	</entity>   
</document>   

</dataConfig

第四步：重启tomcat（startup.bat）