计算机信息检索基础知识
一、 布尔逻辑与检索功能
当人们使用计算机在数据库检索系统或互联网中进行检索时, 常常需要用多个概念所对应的多个关键词的组合进行检索,
仅用一个概念对应的关键词很难完成复杂内容关系的检索要求。通常,一个检索要求中涉及到的多个概念之间与布尔逻辑的
“与”、“或”、“非”都可以通过分析找到明确的对应关系。即使用关键词和反应关键词之间关系的布尔逻辑运算符、通
配符等相关组配符号(含逻辑算符、优先符即括号、位置算符以及英文检索时常用的截词符或通配符),我们就可以将现实
中需要检索的内容或翻译成计算机、网络能够认识的形式或语言,输入到计算机中进行检索,得到我们所要的信息资料,完
成检索。下面简单介绍布尔逻辑中的三个基本运算“与”、“或”、“非”。
1、 逻辑“与”
计算机检索中“与”逻辑关系的常见表示有:“与”、“ AND”、“ and ”、“ * ”等。
逻辑“与”关系的含义:表示概念 A 和概念 B 之间的相交关系,经过“与”运算处理后的表达式: “概念 A”AND“概念 B”
表示一种同时含有概念 A 和概念 B 成份的内容,它已经既不是概念 A,也不是单纯的概念 B 了,该操作使关注的范围缩小
了。如下图所示公共的阴影部分。
例如:概念 A=艺术,概念 B=舞蹈,则概念 A、概念 B 的“AND”逻辑表达式:“ 概念 A”AND“概念 B”也即“艺术”
AND “舞蹈”则表示要检索那些既讲艺术同时又提到舞蹈的信息资源,或者主要讲舞蹈同时又提到艺术的文献信息资源。
2 、 逻辑“或”
计算机检索中“或”逻辑关系的常见表示有:“或”、“ OR”、“ or ”、“ +”等。
逻辑“或”关系的含义:表示概念 A 或概念 B 本身或者两者之间的叠加关系。经过“或”运算处理后的表达式: “概念 A”
OR“概念 B”表示含有“概念 A”或含有“概念 B”或两个概念都包含,该操作使关注的范围扩大了。如下图所示所有的
阴影部分。
例如:概念 A=艺术,概念 B=舞蹈,则概念 A、概念 B 的“ OR”逻辑表达式:“ 概念 A”OR“概念 B”也即“艺术” OR
“舞蹈”则表示要检索那些含有艺术,或者含有舞蹈,或者两者都涉及的文献信息资源。
3 、 逻辑“非”
计算机检索中“非”逻辑关系的常见表示有:“非”、“ NOT”、“ not ”、“ - ”等。
逻辑“非”关系的含义:表示除去概念 A 中所包含的概念 B 之成份的运算。经过“非”运算处理后的表达式:“概念 A”
- “概念 B”表示排除“概念 A”中“概念 B”后,剩下部分的运算,该操作使关注的范围缩小了。如下图所示剩下的阴影
部分。
例如:概念 A=艺术,概念 B=舞蹈,则概念 A、概念 B 的“ NOT”逻辑表达式:“ 概念 A”NOT“概念 B”也即“艺术”
NOT“舞蹈”则表示要检索那些没有涉及舞蹈的艺术文献信息资源。
二、 信息资源的计算机检索
1、 信息资源的计算机检索
信息资源的计算机检索即电子信息资源的检索是指根据要进行检索的问题或课题的要求和目的,认真分析其内容实质,明
确检索范围,确定检索词及其关系,选择合适的检索工具,构造检索表达式,上机检索,通过试检和反馈进行调整,以最大
限度体现检索
目标要求之检索结果的过程。电子信息资源检索一般有以下几个步骤:
(1 )分析问题,明确检索目的和要求
通过问题的分析, 明确该问题的检索要求是属于广泛的、 全面探索摸底型的一次初检还是属于较明确的、 攻关型检索,
或是科技查新类的检索。要明确该问题所涉及的领域和学科有哪些,有没有明确的、隐含的时间范围或时间点要求,是否需
要中文以外的其它语种或地域内的信息等。
(2 )确定检索点、检索词及检索词之间的关系
在问题分析时,原则上与问题密切相关的任何特征都可以成为检索点,并