solr:managed-schema一些字段的意思

最新推荐文章于 2023-10-09 12:18:56 发布

JAVA道人

最新推荐文章于 2023-10-09 12:18:56 发布

阅读量312

点赞数 1

分类专栏： # solr

本文链接：https://blog.csdn.net/dmw412724/article/details/83658626

版权

solr 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

以下面这个汉字的分词器为例.

<fieldType name="text_ik" class="solr.TextField">  
        <analyzer type="index" useSmart="false"
            class="org.wltea.analyzer.lucene.IKAnalyzer" />
        <analyzer type="query" useSmart="true"
            class="org.wltea.analyzer.lucene.IKAnalyzer" />
    </fieldType>

上面这段可以这样理解:新建属性类型,名字叫text_ik.它的分词处理类是org.wltea.analyzer.lucene.IKAnalyzer

 <field name="nickname" type="text_ik" indexed="true" stored="true" multiValued="true"/>

新建一个字段nickname,是text_ik类型的,

indexed	如果为true，则可以在查询中使用该字段的值来检索匹配的文档。	对或错	真正
stored	如果为true，则可以通过查询检索字段的实际值。	对或错	真正
docValues	如果为true，则字段的值将放在面向列的DocValues结构中。	对或错	假
sortMissingFirst sortMissingLast	当排序字段不存在时控制文档的放置。	对或错	假
multiValued	如果为true，则表示单个文档可能包含此字段类型的多个值。	对或错	假
uninvertible	如果为true，则表示`indexed="true" docValues="false"`在查询时字段可以“未反转”以构建大内存数据结构以代替DocValues。出于历史原因，默认为true，但强烈建议用户将其设置`false`为稳定性并`docValues="true"`根据需要使用。	对或错	真正
omitNorms	如果为true，则省略与此字段关联的规范（这将禁用字段的长度规范化，并节省一些内存）。对于所有原始（未分析）字段类型，例如int，float，data，bool和string，默认为true。只有全文字段或字段需要规范。	对或错	*
omitTermFreqAndPositions	如果为true，则忽略此字段的过帐中的术语频率，位置和有效负载。对于不需要该信息的字段，这可以提高性能。它还减少了索引所需的存储空间。依赖于使用此选项在字段上发出的位置的查询将无法查找文档。对于非文本字段的所有字段类型，此属性默认为true。	对或错	*
omitPositions	类似`omitTermFreqAndPositions`但保留术语频率信息。	对或错	*
termVectors termPositions termOffsets termPayloads	这些选项指示Solr维护每个文档的完整术语向量，可选地包括这些向量中每个术语出现的位置，偏移和有效负载信息。这些可用于加速突出显示和其他辅助功能，但在索引大小方面施加了相当大的成本。它们对于Solr的典型用途不是必需的。	对或错	假
required	指示Solr拒绝任何添加没有此字段值的文档的尝试。此属性默认为false。	对或错	假
useDocValuesAsStored	如果该字段已启用docValues，则将此字段设置为true将允许`stored=false`在fl参数中匹配“*”时返回该字段，就好像它是一个存储字段（即使它有）。	对或错	真正
large	大字段始终是延迟加载的，如果实际值<512KB，则只占用文档高速缓存中的空间。此选项需要`stored="true"`和`multiValued="false"`。它适用于可能具有非常大值的字段，以便它们不会缓存在内存中。	对或错	假