Solr的配置

最新推荐文章于 2024-08-17 19:18:43 发布

yaljj84

最新推荐文章于 2024-08-17 19:18:43 发布

阅读量87

点赞数

分类专栏： solr 文章标签： Solr lucene 数据结构 XML Web

solr 专栏收录该内容

31 篇文章 0 订阅

订阅专栏

主要有两个配置文件，都位于Solr的&Solr Home/conf文件夹下
solrconfig.xml 和 schema.xml

一。solrconfig.xml：
1.dataDir parameter，索引文件的存储目录。如果不设置，则默认是&Solr Home/data文件夹。如果指定的不是绝对路径，那么路径就是 web server下的相对路径。
2.indexDefauts Section，Values here affect all index writers and act as a default unless overridden.设置所有的IndexWriter的默认参数。
3.mainIndex Section，lucene options specific to the main on-disk lucene index。
4.Update Handler Section，设置update listener，每次commit需要执行的额外的事件，autoCommit的数值（多少个doc后自动提交）。
5.The Query Section，设置查询相关的参数。
<maxBooleanClauses>，因为在BolleanQuery，WildcardQuery等查询中采用组合TermQuery的方法，这里数字表示最大的组合的数量。
<Caching Section>，缓存设置
<filterCache> 为IndexSearcher使用，当一个IndexSearcher Open时，可以被重新赋于原来的值，或者使用旧的IndexSearcher的值，例如使用LRUCache时，最近被访问的Items将被赋予IndexSearcher。
<queryResultCache> 缓存查询的结果集的docs的id。
<documentCache> 缓存document对象，因为document中的内部id是transient,所以autowarmed为0，不能被autowarmed。
<cache >指定一个cache，用来缓存指定的内容，可以用来缓存常用的数据，或者系统级的数据，可以通过SolrIndexSearcher.getCache(),cacheLookup(), and cacheInsert().等方法来操作。
<useFilterForSortedQuery> ？？？
<queryResultWindowSize>，一次读取数据时读取的数量，比如读取10-19的10条数据，那么，如果queryResultWindowSize=50，那么一次读取50条，0-50.
<HashDocSet maxSize="3000" loadFactor="0.75"/> ？？？
<boolTofilterOptimizer enabled="true" cacheSize="32" threshold=".05"/> ???<enableLazyFieldLoading>false</enableLazyFieldLoading> 延迟读取document中的field，如果不是读取全部的field，那么设置为true能提高性能。

Searcher Section
<New Searcher>,<First Searcher>

Request Handler Plug-in Section

<requestHandler />

types>
<fieldtype>
...
</fieldtype>
</types>
types节点结构大致如此，我们可以定义一系列的fieldtype。
fieldtype通常有以下选项，

sortMissingLast=true|false

sortMissingFirst=true|false

indexed=true|false

stored=true|false

multiValued=true|false

omitNorms=true|false

positionIncrementGap=N
fieldtypes还支持自定义词法分析器。
文本型的数据还可以通过设置compressed属性，来选择是否压缩

compressed=true|false

compressThreshold=<integer>
compressThreshold用来设置压缩的最小的长度，只有当compressed为true的时候才有效。
2.Fields
<fields>
<field type="" indexed="" stored="" />
<field type="" indexed="" stored="" compressed="" compressThreshold="" multiValued="" omitNorms="" />
...
</fields>
Lucene的一个非常强大的特性就是我们在第一次建索引时，不用为每一个预定义，通过<dynamicField>，可以定义通用的field。例如
<dynamicField type="integer" indexed="true" stored="true"/>
这样，所有以_i结尾的field，都使用此设置。
更高级的设置，这些可能并不常用：

termVectors=true|false

storePositions=true|false

storeOffsets=true|false
这些设置可以用来加速高亮显示，以及其他的一些功能。

The Unique Key Field
unique，可以声明一个field为唯一的，如果在add一个新的document进入索引时，有一个相同的unique key已经存在，那么，旧的document将会被删除，并且，新的document插入索引。

The Default Search Field
默认的查询的field，如果查询时没有显示指定某一个field，那么，the default search field将会被搜索。

Default query parser operator
指定默认的操作关系，and 或者 or，如果不指定，默认是or。

其余略。

yaljj84

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Solr的配置

主要有两个配置文件，都位于Solr的&Solr Home/conf文件夹下solrconfig.xml 和 schema.xml一。solrconfig.xml：1.dataDir parameter，索引文件的存储目录。如果不设置，则默认是&Solr Home/data文件夹。如果指定的不是绝对路径，那么路径就是 web server下的相对路径。2.indexDefau...
复制链接

扫一扫