windows搭建solr5.4.1全文搜索引擎

一.   搭建solr服务器

         1.下载solr http://archive.apache.org/dist/lucene/solr/5.4.1/ ,并解压

         2.将..\solr-5.4.1\example\example-DIH目录下的solr文件夹复制到tomcat根目录下

         3.将..\solr-5.4.1\server\solr-webapp目录下的webapp复制到tomcat\webapp下并命名为为solr

         4.将..\solr-5.4.1\server\lib\ext目录下的所有jar包复制到..\apache-tomcat-7.0.67\webapps\solr\WEB-INF\lib下

         5.将..\solr-5.4.1\dist目录下的solr-dataimporthandler-5.4.1.jar和solr-dataimporthandler-extras-5.4.1.jar复制到..\apache-tomcat-7.0.67\webapps\solr\WEB-INF\lib下

         6.将..\solr-5.4.1\server\resources目录下的log4j.properties复制到..\apache-tomcat-7.0.67\webapps\solr\WEB-INF\classes下

         如果没有classes文件,则创建一个

         7.修改..\apache-tomcat-7.0.67\webapps\solr\WEB-INF目录下的web.xml

         找到<env-entry>节点,删除注释,修改如下

<span style="white-space:pre">	</span>  <env-entry>
                <env-entry-name>solr/home</env-entry-name>
                            <!--指向tomcat根目录下的solr文件夹 -->
               <env-entry-value>E:\apache-tomcat-7.0.67\solr</env-entry-value>
               <env-entry-type>java.lang.String</env-entry-type>
          </env-entry>
        

         8.启动tomcat,访问 http://localhost:8080/solr/index.html#/, 出现如下页面说明搭建成功


二.   连接数据库   

         1.SQL配置

         以mysql为例,需要下载mysql-connector-java-bin.jar到..\apache-tomcat-7.0.67\webapps\solr\WEB-INF\lib目录下

         http://dev.mysql.com/downloads/file/?id=462849

         2.建立查询

         进入在solr/home 目录下也就是本例的..\apache-tomcat-7.0.67\solr目录下

         复制db得到collection

         进入..\apache-tomcat-7.0.67\solr\collection目录下,编辑conf文件夹下的db-data-config.xml文件

         <dataConfig>
             <dataSourcedriver="com.mysql.jdbc.Driver"url="jdbc:mysql://localhost:3306/dubbotest?useUnicode=true&characterEncoding=UTF-8&zeroDateTimeBehavior=convertToNull"user="root" password="123456" />
             <document>
                 <entity name="Student" query="select* from t_student"
                         deltaQuery="select * fromt_student where last_modified > '${dataimporter.last_index_time}'"
                                               deltaImportQuery="SELECT* FROM t_student where last_modified >'${dataimporter.last_index_time}'">
                     <field column="id"name="id" />
                                     <fieldcolumn="name" name="name" />
                                     <fieldcolumn="sex" name="sex" />
                                     <fieldcolumn="userId" name="userid" />
                 </entity>
             </document>
         </dataConfig>

         编辑..\apache-tomcat-7.0.67\solr\collection\conf\schema.xml文件,在

         <fieldname="" type="" indexed=""stored=""/>最后,添加

         <fieldname="sex" type="string" indexed="text"stored="false"/>
         <fieldname="userId" type="string" indexed="text"stored="false"/>

         因为id和name字段已有,所以不添加。

         3.重新启动tomcat,可以通过http://localhost:8080/solr/index.html

导入数据


查询数据

       

  不同版本的solr,搭建会有不同,需要注意的是相应的jar包必须添加到

         ..\apache-tomcat-7.0.67\webapps\solr\WEB-INF\lib中


软件介绍: 横瓜全文搜索引擎,是基于Windows平台的全文搜索引擎(不提供网络蜘蛛),最大容量150万网页。 对于150万网页规模的数据,可在30分钟内完成所有架构工作。横瓜全文搜索引擎分词速度约为 2500万字/分钟,约占99.984%的关键词检索时间小于0.001秒。横瓜全文搜索引擎的PC硬件配置, 仅需要700M内存、空闲硬盘10G、文件系统NTFS。横瓜全文搜索引擎采用横瓜分布式Map数据库技 术、分词索引技术、最大左匹配切词技术、倒排技术、MD5摘要信息抽取技术、新词智能识别技术、 硬盘整理加速技术、疑似垂直搜索技术、中文海量词典技术、横瓜HTTP检索服务器web-search缓存 技术、HTM转换TXT技术等。 搜索引擎开发及合作,请联系QQ(601069289) 安装说明: 1、第一次使用软件前,先执行Setup.exe。程序add.exe、body.exe、title.exe为系统内核,勿动! 2、架构搜索步骤:须依次单击websearch.exe程序中的按钮"数据清零"、"导入记录"、"标题分词"、 "正文分词"、"WWW查询"。 3、数据清零。建立新的搜索之前,须单击"数据清零"按钮来清除旧数据和旧索引。 4、websearch.exe可管理记录、索引、分词等,若要执行HTTP检索查询服务,websearch.exe须挂机。 5、数据导入。在web目录下,有Access格式的输入接口文件web.mdb(字段id取值越小排名越靠前)。 将待处理数据输入到web.mdb后,单击“导入记录”按钮,web.mdb中的记录被导入到web.dat。在检 索时直接从web.dat取记录,web.mdb仅起接口作用,导入完成后可自愿删留。对于增量记录,可允许 从web.mdb中多次导入新记录,但新增量的记录,检索排名靠后,增量导入后,须再依次单击按钮 "标题分词"、"正文分词"后,才能被检索到。 6、websearch.exe挂机后,从IE中输入"http://IP地址或域名:7777/"可检索查询。在www目录下, 存有搜索引擎的主页和LOGO,客户可以根据个性需要自行修改。 7、使用本软件,必须开放端口:7000、7001、70002、70003、70004、7777、7778 8、本软件使用的基础词典已经用MD5加密封装,用户可以在dic.txt中自由添加新词,新词被添加到 dic.txt后,被检索的几率变大。若不添加新词,也可以被检索到,只是几率稍小些。 9、web目录中web.mdb的记录是赠送测试用的,可以将待处理数据输入“模板web.mdb”替换该文件。 10、不得将本软件用于赢利目的、销售他人、非法用途等,否则将会被追究法律责任。 搜索引擎开发及合作,请联系QQ(601069289)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值