Solr的配置

主要有两个配置文件,都位于Solr的&Solr Home/conf文件夹下
solrconfig.xml 和 schema.xml

一。solrconfig.xml:
1.dataDir parameter,索引文件的存储目录。如果不设置,则默认是&Solr Home/data文件夹。如果指定的不是绝对路径,那么路径就是 web server下的相对路径。
2.indexDefauts Section,Values here affect all index writers and act as a default unless overridden.设置所有的IndexWriter的默认参数。
3.mainIndex Section,lucene options specific to the main on-disk lucene index。
4.Update Handler Section,设置update listener,每次commit需要执行的额外的事件,autoCommit的数值(多少个doc后自动提交)。
5.The Query Section,设置查询相关的参数。
<maxBooleanClauses>,因为在BolleanQuery,WildcardQuery等查询中采用组合TermQuery的方法,这里数字表示最大的组合的数量。
<Caching Section>,缓存设置
<filterCache> 为IndexSearcher使用,当一个IndexSearcher Open时,可以被重新赋于原来的值,或者使用旧的IndexSearcher的值,例如使用LRUCache时,最近被访问的Items将被赋予IndexSearcher。
<queryResultCache> 缓存查询的结果集的docs的id。
<documentCache> 缓存document对象,因为document中的内部id是transient,所以autowarmed为0,不能被autowarmed。
<cache >指定一个cache,用来缓存指定的内容,可以用来缓存常用的数据,或者系统级的数据,可以通过SolrIndexSearcher.getCache(),cacheLookup(), and cacheInsert().等方法来操作。
<useFilterForSortedQuery> ???
<queryResultWindowSize>,一次读取数据时读取的数量,比如读取10-19的10条数据,那么,如果queryResultWindowSize=50,那么一次读取50条,0-50.
<HashDocSet maxSize="3000" loadFactor="0.75"/> ???
<boolTofilterOptimizer enabled="true" cacheSize="32" threshold=".05"/> ???<enableLazyFieldLoading>false</enableLazyFieldLoading> 延迟读取document中的field,如果不是读取全部的field,那么设置为true能提高性能。

Searcher Section
<New Searcher>,<First Searcher>

Request Handler Plug-in Section

<requestHandler />

types>
<fieldtype>
...
</fieldtype>
</types>
types节点结构大致如此,我们可以定义一系列的fieldtype。
fieldtype通常有以下选项,


sortMissingLast=true|false

sortMissingFirst=true|false

indexed=true|false

stored=true|false

multiValued=true|false

omitNorms=true|false

positionIncrementGap=N
fieldtypes还支持自定义词法分析器。
文本型的数据还可以通过设置compressed属性,来选择是否压缩


compressed=true|false

compressThreshold=<integer>
compressThreshold用来设置压缩的最小的长度,只有当compressed为true的时候才有效。
2.Fields
<fields>
<field type="" indexed="" stored="" />
<field type="" indexed="" stored="" compressed="" compressThreshold="" multiValued="" omitNorms="" />
...
</fields>
Lucene的一个非常强大的特性就是我们在第一次建索引时,不用为每一个预定义,通过<dynamicField>,可以定义通用的field。例如
<dynamicField type="integer" indexed="true" stored="true"/>
这样,所有以_i结尾的field,都使用此设置。
更高级的设置,这些可能并不常用:

termVectors=true|false

storePositions=true|false

storeOffsets=true|false
这些设置可以用来加速高亮显示,以及其他的一些功能。

The Unique Key Field
unique,可以声明一个field为唯一的,如果在add一个新的document进入索引时,有一个相同的unique key已经存在,那么,旧的document将会被删除,并且,新的document插入索引。

The Default Search Field
默认的查询的field,如果查询时没有显示指定某一个field,那么,the default search field将会被搜索。

Default query parser operator
指定默认的操作关系,and 或者 or,如果不指定,默认是or。

其余略。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
您可以按照以下步骤配置Solr的增量更新: 1. 在Solrweb.xml文件中添加增量更新监听器。在web.xml文件中添加以下代码段: ``` <listener> <listener-class>org.apache.solr.handler.dataimport.scheduler.ApplicationListener</listener-class> </listener> ``` 这将引入增量更新的监听器。 2. 配置solrconfig.xml文件。在solrconfig.xml文件中,您需要配置以下内容: - 设置dataImportHandler请求处理器。确保以下的请求处理器配置solrconfig.xml的<requestHandler>部分中: ``` <requestHandler name="/dataimport" class="solr.DataImportHandler"> <lst name="defaults"> <str name="config">solr-data-config.xml</str> </lst> </requestHandler> ``` - 设置自动调度器。在solrconfig.xml的<config>部分中添加以下配置: ``` <autoCommit> <maxDocs>10000</maxDocs> <maxTime>15000</maxTime> </autoCommit> <updateHandler class="solr.DirectUpdateHandler2"> <updateLog> <str name="dir">${solr.data.dir:}</str> </updateLog> </updateHandler> <requestDispatcher handleSelect="true" > <requestParsers enableRemoteStreaming="true" multipartUploadLimitInKB="2048000" /> </requestDispatcher> ``` - 配置增量更新定时任务。在solrconfig.xml的<config>部分中添加以下配置: ``` <dataConfig> <dataSource type="JdbcDataSource" driver="your_driver" url="your_jdbc_url" user="your_username" password="your_password" /> <document> <entity name="<your_entity_name>" query="<your_query>" deltaQuery="SELECT id FROM your_table WHERE last_modified > '${dataimporter.last_index_time}'"> <field column="id" name="id" /> <!-- 增加其他字段 --> </entity> </document> </dataConfig> ``` 注意替换上述代码中的占位符,例如your_driver、your_jdbc_url、your_username、your_password、your_entity_name、your_query和your_table,根据您的实际情况配置。 3. 配置managed-schema文件。确保managed-schema文件中包含增量更新需要的字段定义。 4. 下载并安装增量更新的jar包。从https://code.google.com/p/solr-dataimport-scheduler/downloads/list下载apache-solr-dataimportscheduler-1.0-with-source.jar,并将它放置在Tomcat目录的相应位置。 完成上述配置后,您可以启动项目并开始使用Solr的增量更新功能。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [solr自动增量更新](https://blog.csdn.net/SSHH_ZHU/article/details/103968258)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [Solr的增量更新和全量更新对比](https://blog.csdn.net/qq_42941671/article/details/108324169)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [solr配置增量更新和定时更新数据库索引](https://blog.csdn.net/weixin_33433067/article/details/113541424)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值