solr学习一（一大堆的学习资料）

最新推荐文章于 2016-06-12 16:27:43 发布

asdwjb

最新推荐文章于 2016-06-12 16:27:43 发布

阅读量134

点赞数

分类专栏： solr Lucene 文章标签： java

本文链接：https://blog.csdn.net/asdwjb/article/details/84150759

版权

Lucene 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

solr

4 篇文章 0 订阅

订阅专栏

[size=large]
这篇博客含有海量资料，学习solr必备字典 :evil:
大概看完solr就基本上手了。
solr原味资料：http://wiki.apache.org/solr/FrontPage
（
http://wiki.apache.org/solr/QueryParametersIndex
http://wiki.apache.org/solr/SchemaXml
http://wiki.apache.org/solr/CoreAdmin
http://wiki.apache.org/solr/ExtractingRequestHandler
http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters
http://wiki.apache.org/solr/LanguageAnalysis
http://wiki.apache.org/solr/DataImportHandler#Overview
http://wiki.apache.org/solr/Solrj
http://wiki.apache.org/solr/SolrQuerySyntax
）
solr咀嚼资料一（如联接消失可下载附件）：http://clayz.iteye.com/blog/240366
solr咀嚼资料二：http://www.ibm.com/developerworks/cn/java/j-solr1/#basics
solr咀嚼资料三：http://www.ibm.com/developerworks/cn/java/j-solr-update/index.html
solr咀嚼资料四（多核（MultiCore）配置）：http://aixiangct.blog.163.com/blog/static/9152246120111128114423633/
slor咀嚼资料五（几个solr高手）：http://blog.csdn.net/aidayei/article/category/829139
http://blog.chenlb.com/category/solr-search
http://lianj-lee.iteye.com/category/71985
http://passover.blog.51cto.com/2431658/568972
http://wutaoo.iteye.com/category/58704?show_full=true
http://blognojava.iteye.com/blog/1187996

DataImportHandler的译文：http://mxsfengg.blog.163.com/blog/static/26370218200810250524813/

讲的较没用，但很深的：http://liuxinglanyue.iteye.com/category/133220

solr源码分析：
http://www.cnblogs.com/mandela/archive/2011/05/10/2041753.html

solr讲的不错的solr高级配置：http://hi.baidu.com/mutourenoo/blog/item/63f430359ac23282a71e1269.html

[color=red]solr.solr.home的配置和理解:[/color]
配置的是程序主目录，程序根据这个目录查找源文件，如System.setProperty("solr.solr.home", "./");源码分析中有介绍：http://www.cnblogs.com/mandela/archive/2011/05/10/2041753.html

在index页面在赋予下面多索引的链接。方法如下
<%
org.apache.solr.core.CoreContainer cores = (org.apache.solr.core.CoreContainer)request.getAttribute("org.apache.solr.CoreContainer");
if( cores != null
&& cores.getCores().size() > 0 // HACK! check that we have valid names...
&& cores.getCores().iterator().next().getName().length() != 0 ) {
for( org.apache.solr.core.SolrCore core : cores.getCores() ) {%>
<a href="<%= core.getName() %>/admin/">Admin <%= core.getName() %></a><br/>
<% }} else { %>
<a href="admin/">Solr Admin</a>
<% } %>

[color=red]建议建立了一个拷贝字段，将所有的全文字段复制到一个字段中，以便进行统一的检索：[/color]
<field name="all" type="text" indexed="true" stored="false" multiValued="true"/>
并在拷贝字段结点处完成拷贝设置：
Xml代码
<copyField source="name" dest="all"/>
<copyField source="summary" dest="all"/>

[color=red]defaultSearchField[/color]
可以将某个Field设置为defaultSearchField，当没有明确的查询Field的时候，来查询这个Filed，该Filed一般设置为multiValued，copyField多个Filed

[color=red]Solr Multicore 是 solr 1.3 的新特性。其目的一个solr实例，可以有多个搜索应用。
在solr.xml中配置，如：[/color]
<?xml version="1.0" encoding="UTF-8" ?>
<solr persistent="false">
<cores adminPath="/admin/cores">
<core name="core0" instanceDir="core0" />
<core name="core1" instanceDir="core1" />
</cores>
</solr>
instanceDir是solr.home，即core0，core1索引资源文件所在的路径
name是solr请求的路径，如http://localhost:8393/core0/admin/可进入core的admin页面，
solrj可以用http://localhost:8393/core0/..对该索引请求操作

[color=red]ExtractingRequestHandler是文件提取，可用于word、pdf等文件提取[/color]
可参考http://xinyangwjb.iteye.com/admin/blogs/1405676

[color=red]中文分词采用lucene自带的CjkAnalyzer分词：[/color]
http://lianj-lee.iteye.com/blog/519254
http://blog.csdn.net/cnhome/article/details/5543308
采用cjk有俩原因，一、我使用的solr的版本只有1.4.0，lucene的版本也只有2.9.1，自带的中文分析器只有cjk。
二、cjk不用引入外部的jar报和字典库，简单，快~~

[color=red]UniqueKey的问题：[/color]
默认是有这个属性的，也可以没有，如果有UniqueKey，add的时候，会先看该UniqueKey是否存在，如果存在则覆盖，不存在则新增

[color=red]对于DateField的查询：[/color]
日期格式的字段的查询很恶心，必须是UTC格式，并且效率低下，建议是先将date字段转化为int或者long再存入索引。http://wiki.apache.org/solr/SolrQuerySyntax

[/size]

asdwjb

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
solr学习一（一大堆的学习资料）

[size=large]这篇博客含有海量资料，学习solr必备字典 :evil:大概看完solr就基本上手了。 solr原味资料：http://wiki.apache.org/solr/FrontPage（ http://wiki.apache.org/solr/QueryParametersIndex http://wiki.apache.org/solr/S...
复制链接

扫一扫

专栏目录