Solr solrconfig.xml的翻译

最新推荐文章于 2023-05-21 11:08:31 发布

chenjia3615349

最新推荐文章于 2023-05-21 11:08:31 发布

阅读量786

点赞数

分类专栏： solr

solr 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

Solr XML lucene Cache 多线程

solrconfig.xml
solrconfig.xml文件包含了大部分的参数用来配置Solr本身的。
dataDir parameter：<dataDir>/var/data/solr</dataDir>
用来指定一个替换原先在Solr目录下默认存放所有的索引数据，可以在Solr目录以外的任意目录中。如果复制使用后应该符合该参数。如果这个目录不是绝对路径的话，那么应该以当前的容器为相对路径。
mainIndex ：
这个参数的值用来控制合并多个索引段。
<useCompoundFile>：通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。这可有助于减少 Solr 使用的文件句柄数目，代价是降低了性能。除非是应用程序用完了文件句柄，否则false 的默认值应该就已经足够。
mergeFactor：
决定低水平的 Lucene 段被合并的频率。较小的值（最小为2）使用的内存较少但导致的索引时间也更慢。较大的值可使索引时间变快但会牺牲较多的内存。
maxBufferedDocs：
在合并内存中文档和创建新段之前，定义所需索引的最小文档数。段是用来存储索引信息的 Lucene 文件。较大的值可使索引时间变快但会牺牲较多的内存。
maxMergeDocs：
控制可由 Solr ,000) 最适合于具有合并的Document 的最大数。较小的值 (< 10大量更新的应用程序。该参数不允许lucene在任何索引段里包含比这个值更多的文档，但是，多余的文档可以创建一个新的索引段进行替换。
maxFieldLength：
对于给定的 Document，控制可添加到 Field 的最大条目数，进而截断该文档。如果文档可能会很大，就需要增加这个数值。然而，若将这个值设置得过高会导致内存不足错误。
unlockOnStartup：
unlockOnStartup 告知 Solr 忽略在多线程环境中用来保护索引的锁定机制。在某些情况下，索引可能会由于不正确的关机或其他错误而一直处于锁定，这就妨碍了添加和更新。将其设置为 true 可以禁用启动锁定，进而允许进行添加和更新。
<mainIndex>
    
    <useCompoundFile>false</useCompoundFile>
    <mergeFactor>10</mergeFactor>
    <maxBufferedDocs>1000</maxBufferedDocs>
    <maxMergeDocs>2147483647</maxMergeDocs>
    <maxFieldLength>10000</maxFieldLength>
</mainIndex>

updateHandler：
这个更新处理器主要涉及底层的关于如何更新处理内部的信息。（此参数不能跟高层次的配置参数RequestHandlers对处理发自客户端的更新相混淆）。
<updateHandler class="solr.DirectUpdateHandler2">

    
缓冲更新这么多的数目，设置如下比较低的值，可以约束索引时候所用的内存
    <maxPendingDeletes>100000</maxPendingDeletes>
等待文档满足一定的标准后将自动提交，未来版本可以扩展现有的标准
    
    <autoCommit>
      <maxDocs>10000</maxDocs> 
触发自动提交前最多可以等待提交的文档数量
      <maxTime>86000</maxTime> 
在添加了一个文档之后，触发自动提交之前所最大的等待时间
    </autoCommit>

这个参数用来配置执行外部的命令。
一个postCommit的事件被触发当每一个提交之后
<listener event="postCommit"class="solr.RunExecutableListener">
      <strname="exe">snapshooter</str>
      <strname="dir">solr/bin</str>
      <boolname="wait">true</bool>
      
    </listener>
exe--可执行的文件类型
dir--可以用该目录做为当前的工作目录。默认为"."
wait--调用线程要等到可执行的返回值
args--传递给程序的参数默认nothing
env--环境变量的设置默认nothing

<query>
    
    <maxBooleanClauses>1024</maxBooleanClauses>

<query>:
控制跟查询相关的一切东东。

Caching：修改这个参数可以做为索引的增长和变化。


    <filterCache
      class="solr.LRUCache"
      size="512"
      initialSize="512"
      autowarmCount="256"/>

   
查询结果缓存
    <queryResultCache
      class="solr.LRUCache"
      size="512"
      initialSize="512"
      autowarmCount="256"/>


由于Lucene的内部文档ID标识（文档名称）是短暂的，所以这种缓存不会被自动warmed。
    <documentCache
      class="solr.LRUCache"
      size="512"
      initialSize="512"
      autowarmCount="0"/>

    
这么做的的关键就是应该明确规定实现solr.search.CacheRegenerator接口如果autowarming是比较理想化的设置。
    

    
   <useFilterForSortedQuery>true</useFilterForSortedQuery>

    

一种优化用于queryResultCache，当一个搜索被请求，也会收集一定数量的文档ID做为一个超集。举个例子，一个特定的查询请求匹配的文档是10到19，此时，queryWindowSize是50，这样，文档从0到50都会被收集并缓存。这样，任何更多的在这个范围内的请求都会通过缓存来满足查询。
   <queryResultWindowSize>50</queryResultWindowSize>

    
    <HashDocSet maxSize="3000"loadFactor="0.75"/>

    
    <boolTofilterOptimizer enabled="true"cacheSize="32" threshold=".05"/>

    
   <enableLazyFieldLoading>false</enableLazyFieldLoading>

chenjia3615349

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Solr solrconfig.xml的翻译

SolrXMLluceneCache多线程 solrconfig.xml solrconfig.xml文件包含了大部分的参数用来配置Solr本身的。 dataDir parameter：/var/data/solr用来指定一个替换原先在Solr目录下默认存放所有的索引数据，可以在Solr目录以外的任意目录中。如果复制使用后应该符合
复制链接

扫一扫

专栏目录