以下面这个汉字的分词器为例.
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" useSmart="false"
class="org.wltea.analyzer.lucene.IKAnalyzer" />
<analyzer type="query" useSmart="true"
class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType>
上面这段可以这样理解:新建属性类型,名字叫text_ik.它的分词处理类是org.wltea.analyzer.lucene.IKAnalyzer
<field name="nickname" type="text_ik" indexed="true" stored="true" multiValued="true"/>
新建一个字段nickname,是text_ik类型的,
indexed | 如果为true,则可以在查询中使用该字段的值来检索匹配的文档。 | 对或错 | 真正 |
stored | 如果为true,则可以通过查询检索字段的实际值。 | 对或错 | 真正 |
docValues | 如果为true,则字段的值将放在面向列的DocValues结构中。 | 对或错 | 假 |
sortMissingFirst sortMissingLast | 当排序字段不存在时控制文档的放置。 | 对或错 | 假 |
multiValued | 如果为true,则表示单个文档可能包含此字段类型的多个值。 | 对或错 | 假 |
uninvertible | 如果为true,则表示indexed="true" docValues="false" 在查询时字段可以“未反转”以构建大内存数据结构以代替DocValues。出于历史原因,默认为true,但强烈建议用户将其设置false 为稳定性并docValues="true" 根据需要使用。 | 对或错 | 真正 |
omitNorms | 如果为true,则省略与此字段关联的规范(这将禁用字段的长度规范化,并节省一些内存)。对于所有原始(未分析)字段类型,例如int,float,data,bool和string,默认为true。只有全文字段或字段需要规范。 | 对或错 | * |
omitTermFreqAndPositions | 如果为true,则忽略此字段的过帐中的术语频率,位置和有效负载。对于不需要该信息的字段,这可以提高性能。它还减少了索引所需的存储空间。依赖于使用此选项在字段上发出的位置的查询将无法查找文档。对于非文本字段的所有字段类型,此属性默认为true。 | 对或错 | * |
omitPositions | 类似omitTermFreqAndPositions 但保留术语频率信息。 | 对或错 | * |
termVectors termPositions termOffsets termPayloads | 这些选项指示Solr维护每个文档的完整术语向量,可选地包括这些向量中每个术语出现的位置,偏移和有效负载信息。这些可用于加速突出显示和其他辅助功能,但在索引大小方面施加了相当大的成本。它们对于Solr的典型用途不是必需的。 | 对或错 | 假 |
required | 指示Solr拒绝任何添加没有此字段值的文档的尝试。此属性默认为false。 | 对或错 | 假 |
useDocValuesAsStored | 如果该字段已启用docValues,则将此字段设置为true将允许stored=false 在fl参数中匹配“*”时返回该字段,就好像它是一个存储字段(即使它有)。 | 对或错 | 真正 |
large | 大字段始终是延迟加载的,如果实际值<512KB,则只占用文档高速缓存中的空间。此选项需要stored="true" 和multiValued="false" 。它适用于可能具有非常大值的字段,以便它们不会缓存在内存中。 | 对或错 | 假 |