1. 安装Java 虚拟机
2. 下载安装tomcat,版本5.5以上。安装目录:例如D:\mypro\solr,检查tomcat安装。http://localhost:8080/ 正常打开tomcat页面则为安装正确。
3. 找到D:\mypro\solr\conf \server.xml 修改如下:
<Connectorport="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8"/>
4. 下载 solr 发行包解压缩到临时目录 c:\temp\solrZip\
5. 创建solr 运行目录D:\mypro\solr\solr,拷贝c:\temp\solrZip\example\solr\目下所有文件到该目录
6. 从c:\temp\solrZip\dist\找到*solr*.war拷贝到D:\mypro\solr\webapps 重命名 为 solr.war
7. 找到D:\mypro\solr\conf\Catalina\localhost\solr.xml(如果没有该目录以及文件,请新建) 添加内容如下:
<Context docBase="D:\mypro\solr\webapps\solr.war" debug="0" crossContext="true" >
<Environment name="solr/home" type="java.lang.String" value="D:\mypro\solr\sol" override="true" />
</Context>
8. 启动tomcat 访问http://localhost:8080/solr/admin 正常出现页面,则安装正确
9. 如果要自定义修改索引目录,请修改D:\mypro\solr\solr\conf\solrconfig.xml,找到</dataDir>修改
<dataDir>${solr.data.dir:D:\mypro\solr\solr\data}</dataDir>
附:
1. 批量生成索引
使用Solr的java 包生成索引:
查看帮助:java -jarpost.jar –help
提交索引(首先要进入命令行,cd进入该索引文件夹,还需将post.jar拷贝到该目录下,执行下面的命令。该命令也可单独提交单个文件,只需把*.xml 改为具体的xml文件名即可):
java -Durl=http://localhost:8080/solr/update -Dcommit=yes -jar post.jar *.xml
2. 中文分词
目前Lucene 的中文分词主要有:
paoding :Lucene 中文分词“庖丁解牛” PaodingAnalysis。
imdict :imdict 智能词典所采用的智能中文分词程序。
mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法实现的中文分词器。
ik :采用了特有的“正向迭代最细粒度切分算法“,多子处理器分析模式。
目前我的中文分词采用mmseg4j
参考资料
http://wiki.apache.org/solr/
Solrj使用
http://wiki.apache.org/solr/Solrj
http://www.ibm.com/developerworks/cn/java/j-solr1/
http://www.ibm.com/developerworks/cn/java/j-solr2/
http://www.iteye.com/topic/138594
http://www.iteye.com/topic/250708
http://www.iteye.com/topic/364513
http://www.blogjava.net/RongHao/archive/2007/11/06/158621.html
嵌入式Solr
http://wiki.apache.org/solr/Solrj#EmbeddedSolrServer
http://blog.chenlb.com/2009/04/solr-chinese-segment-mmseg4j-use-demo.html
http://www.blogjava.net/aoxj/archive/2010/07/21/326775.html