关闭

Solr中配置文件schema.xml之copyField 与multiValued用途

162人阅读 评论(0) 收藏 举报
分类:

原文链接:http://hbin8668.blog.163.com/blog/static/178844311201375113752169/

copyField multiValued用途

在我们的应用中经常会有这种情形:当用户输入某个字符串查找时,需要如果在标题及内容中存在这个字会串时均要把记录加载出来,通过引入copyFieldmultiValue这两个标签便可解决这种问题。如:

1.   <schema name="eshequn.post.db_post.0" version="1.1"  

2.       xmlns:xi="http://www.w3.org/2001/XInclude">  

3.        <fields>  

5.           <field name="title" type="text" indexed="true" stored="false" />  

6.          <field name="content" type="text" indexed="true" stored="false" />  

8.           <field name="tc" type="text" indexed="true" stored="false" multiValued="true"/>  

10.      </fields>  

11.      <copyField source="title" dest="tc" />  

12.      <copyField source="content" dest="tc" />  

  </schema>

字段title是文章的标题,字段content是文章的摘要,字段tc是文章标题和内容的联合。添加索引文档时,只需要传入titlecontent字段的内容,solr会自动索引ta字段。 这算不上多高级的功能,不过如果让你来实现这个功能,你会怎么做呢?我接手的搜索系统原来就有类似的功能,它的做法是,将ta字段的文本合并,塞到ta 字段,无可厚非的做法。

不过,有人注意到luceneDocument类提供的public final Field[] getFields(String name)类似函数不?也就是说,lucene中的一个name可以对应多个Fieldsolr在添加索引时,会检查field name是不是copyField集合中的source,是的话就以其value构造dest field。如果dest由多个source构成,就需要将其指定为multiValued对于查询来说,如果查询字段要来自多个字段,一种选择是使用CopyField,化多个字段为一个字段,缺点是不能区分各个字段的重要度差别。比如文章的标题和摘要,标题就要比摘要重要性更强,如果有这方面的要求,可以选择查询多个字段的做法。

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:6275次
    • 积分:115
    • 等级:
    • 排名:千里之外
    • 原创:3篇
    • 转载:18篇
    • 译文:0篇
    • 评论:0条