信息检索导论学习笔记(一)布尔检索
定义
信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。
倒排索引
为提高查询效率,建立倒排索引
习题解答:
1-10
X or Y
Intersect(p1,p2)
answer <- {}
while p1!=NULL and p2!=NULL
do if(docID(p1)=docID(p2))
then ADD(answer,docID(p1))
else
then ADD(answer,docID(p1))
then ADD(answer,docID(p2))
p1<-next(p1)
p2<-next(p2)
while p1!=NULL
ADD(answer,docID(p1))
p1<-next(p1)
while p2!=NULL
ADD(answer,docID(p2))
p1<-next(p2)
return answer
Intersect(p1,p2)
answer <- {}
while p1!=NULL and p2!=NULL
do if(docID(p1)=docID(p2))
then ADD(answer,docID(p1))
else
then ADD(answer,docID(p1))
then ADD(answer,docID(p2))
p1<-next(p1)
p2<-next(p2)
while p1!=NULL
ADD(answer,docID(p1))
p1<-next(p1)
while p2!=NULL
ADD(answer,docID(p2))
p1<-next(p2)
return answer