武汉大学-黄如花-信息检索课程学习笔记二
一、信息检索基本方法
1.布尔逻辑检索
①逻辑与:AND, *
②逻辑或:OR, +
③逻辑非:NOT, AND NOT, -
从上图可以看出,三种检索方式中只有第二种是使检索结果变多,其他两种方法均使检索结果变少。
举例1
比如你要搜索移动学习相关的内容,如果你只输入移动学习检索结果不是很多,从上文我们已经知道,OR可以使检索结果变多,这个时候我们可以添加一些跟移动学习相关的词,比如我们的检索式可以这样写
移动学习OR数字学习OR…
举例2
比如你要查找美国信息资源管理政策有关的文献,那它的检索式是什么呢?
美国AND信息资源管理AND政策
或者:American AND “information resource management” AND policy
注意:中间的词组是用双引号连接起来的,为什么要用双引号后面会做解释。
举例3
比如你要查找信息素养有关的信息资源,你会输入什么检索式?仅仅输入信息素养是不够的,我们需要把它的同义词用OR连接起来。
信息素养OR信息素质OR咨询素养
举例4
假如你是个店员,有位顾客需要购买含有草莓或香草但不含巧克力口味的冰淇淋,那你需要怎么做呢?换句话说,你需要用怎样的检索式呢?
(strawberry OR vanilla)NOT chocoloate
注意:为什么要加括号呢?因为布尔逻辑是有顺序的,先后顺序为NOT、AND、OR
总结
AND、NOT是使检索结果减少的布尔逻辑词,OR是使检索结果增加的布尔逻辑词。当你需要使检索结果增多的时候选择OR,当你需要减少搜索结果的时候选择AND或者NOT。
2.临近检索
①PRE/0、P/0
两个要求:
(1)顺序不能颠倒
(2)不能插入任何单词
比如 Wuhan P/0 University,也就是说Wuhan和University之间是不允许有单词插入且顺序不允许颠倒,但是可以插入空格、标点符号,像下面这样
Wuhan University
Wuhan-University
Wuhan,University
…
②PRE/#、P/#
两个要求:
(1)顺序不能颠倒
(2)允许插入一定数量的单词。(一定数量指的是多少呢?#这里的数字指的是几,就能插入多少个单词。