全文检索框架solr6和Analyzer词法分析器(中文用paoding)

安装

下载解压solr,进入bin目录

./solr start 启动

./solr stop all 关闭

打开http://localhost:8983/solr

索引库

拷贝solr/server/solr/configsets/basic_configs的conf文件夹

到solr/server/solr/new_core/下,new_core是新建的目录文件

使用Core Admin来Add Core,instanceDir就是目录new_core

一个core相当于一个索引库对应一个schema,如果你是从MySQL中拿数据相当于mysql中的一张表

关联mysql

schema.xml 这个是索引的结构定义的文件,定义了字段的名称,类型,索引与否,分词方法等(最新版本在文件系统中叫managed-schema)

solrconfig.xml 这个文件是solr的基础文件,主要配置了solr的各种web请求处理器、日志、缓存等
data-config.xml 这个是配置连接mysql数据库的配置信息,名称可以自己修改,也是放在conf 下面(没有可以自行创建)

1.修改solrconfig.xml

<requestHandler name="/select" class="solr.SearchHandler">前面上加上一个dataimport的处理的Handler

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
       <lst name="defaults">
          <str name="config">data-config.xml</str>
       </lst>
  </requestHandler>

2.在同目录下添加data-config.xml

<?xml version="1.0" encoding="UTF-8"?>
<dataConfig>
    <dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/zrl" user="root" password="root" />
  <document name="testDoc">
        <entity name="user" pk="id"
                query="select * from user">
          <field column="id" name="id"/>
          <field column="userName" name="userName"/>
            <field column="userAge" name="userAge"/>
            <field column="userAddress" name="userAddress"/>
     </entity>
  </document>
</dataConfig>

3.添加字段到managed-schema

 
  
< field name ="id" type ="int" indexed ="true" stored ="true" required ="true" multiValued ="false" />
 
  
< field name ="userName" type ="text_general" indexed ="true" stored ="true" />
< field name ="userAge" type ="int" indexed ="true" stored ="true" />
< field name ="userAddress" type ="text_general" indexed ="true" stored ="true" />

拷贝mysql-connector-java-5.1.22-bin.jar和solr-dataimporthandler-4.10.3.jar到Solr6\server\solr\solr-webapp\webapp\WEB-INF\lib。一个是mysql的java驱动自己下载,另一个在Solr6\dist目录中。

重启Solr。如果配置正确就可以启动成功。

全文检索框架solr+paoding或IKAnalyzer

一、首先建立Analyzer词法分析器(中文用paoding),然后确定本地存储还是内存存储,接着IndexWriter建立索引,最后关闭IndexWriter提交内容

二、先DirectoryReader打开存储位置,然后IndexSearcher 创建搜索器,最后类似SQL进行关键字查询

Solr+Zookeeper(分布式框架)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值