LUCENE读书笔记20070703

 

20070703
2 Document 和Field
 终于要看到重点部分了。大体过了一遍,讲的还可以,和以前英文的差不多,那就看中文的吧,谁叫咱水平差馁。
这里主要讲了Document 和Field,看征服AJAX讲了半天,也就是我上面说的那些意思,pass这一块,仔细看Document的源代码吧,发现也没啥子,就是Document 和Field的聚合关系而已,再PASS…………。
 Field 到了,关键阿这是,我咋知道?以前看过阿。现在有中文教程了,应该能看得更明白吧?
 
前面说到了,俺认为Field就相当于是数据库里字段的概念。在建立索引的时候,我们可以给一行设置字段;在检索的时候,我们可以根据他去查找符合要求的(Document),再找到它的其他的Field(里面可能就是你要的数据)。
一个Field有三个方面的属性:
A 是否被切词:俺不懂,书上说以后讲,那俺就以后再看。
B 是否被索引:这个好懂,不就是以后用于检索的字段么?
C 是否存储:书上说的是是否将Field内的信息原封不动的存储在索引中,俺认为就是那种内容字段,不用于检索。
根据上面三个属性Field分成了4种类型(据说lucene2已经不分了,郁闷)。
   1 Text:这种类型中的内容需要被切词和索引,就是说这种类型是用来搜索的,并且是经过切词了的
这种类型有两个构造函数Field.Text(String ,String ); Field.Text(String ,Reader );创建Text 类型的Field方式很奇怪,像是一个简单工厂模式。
这两种方式构造出来的Text是不一样的,很不一样:
Field.Text(String ,String )构造出来的不仅仅可以用来索引,还可以进行数据重现。
Field.Text(String ,String )构造出来的只能进行索引,但不能重现,也就是说,第上面的把数据变成索引的时候还存了一份原来的数据,而这个就直接把数据索引化了,原来的数据并没有进行备份,在检索的时候是得不到存进去的原始值的。
   2 Keyword: 这种类型的字段,是不进行切词的,但会进行索引(关键字么,已经是被索引的最小单位了,按这个意思,那么切词是不是说将数据切成最小的检索单位呢??)
   3 UnIndexed 这种类型简单,既不切词也不用索引,只是存储内容。用来存储根据检索条件检索到的展示数据。
 4 UnStored 这种和3 是正好相反的,仅进行索引和切词,但不存储原始数据在索引中。 那么这和 Field.Text(String ,Reader ) 起到的作用是不是一样呢??

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值