Solr-之文件索引

*、准备工作

#一个容纳solr的Tomcat容器
tomcat放solr4.*的solr.war包
#一个任一的文件目录solr_home
solr_home下放solr4.*中的collection1文件夹
#一个core1文件夹来源可以是solr4.*的example的muti里面的core1
core1也放于solr_home根目录下
#放于core1/conf下的stopwords.txt和synonyms.txt两个文件
#放于core1下的extract即jar的集合
注意路径,详见教程

 

*、执行流程

#solr4.10.3部署tomcat7
https://blog.csdn.net/u010623907/article/details/45056039
另外:其实copy的solr文件夹只需要collection1即可
#solr4.*新建一个core
https://blog.csdn.net/clj198606061111/article/details/21288499
#solr4.*索引pdf.txt.word等文件javademo程序
https://blog.csdn.net/u011439289/article/details/41721937
另外:注意extract文件夹的位置解释
#solr4.*索引pdf.txt.word等文件-补充1
https://blog.csdn.net/clj198606061111/article/details/21492457
另外:urlstring注意没有#直接/solr/core_name即可
#solr4.*索引pdf.txt.word等文件-补充2
https://blog.csdn.net/lipingping951462/article/details/52711495
另外:该链接对代码有注释更易理解
还有ContentStreamUpdateRequest的参数一定要和solrconfig.xml配置requestHandler的一样
不然你可能会遇到下面的异常:
solr.client.solrj.impl.HttpSolrServer$RemoteSolrException: Expected mime type
曾参考过以下案例,才检查出粗心造成的问题即core或handler的配置路径有误
https://www.cnblogs.com/flybird2014/p/4093150.html

 

*、运行java程序后可以查看到具体索引后的信息

单机单core版本:
new HttpSolrServer(指定core路径的请求)-->server
server.request(...)即可
集群多core版本:
CloudSolrServer获取连接-->server
server.request(...)即可

 

*、为何文本内容自动进入text属性了?没找到,无语ing

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值