内容
专业检索常用方法及应用实例
随着计算机和网络技术市场的迅速发展,网络资源越来越被人们认同,越来越多的人利用计算机从专用数据库或公网上查找信息,如何采用一种有效的方法,从海量信息中快速又准确地找到自己所需确实是一个问题。对于专业检索人员来说,虽然他们有一批专用的检索数据库可以利用,但即使是这类数据库信息的存储量也是相当惊人的,很难普通用户通常使用的W e b 方式完成工作,开始从网上查找所需的信息,而手
工检索几乎如何在庞大的信息库中快速又准确地找到真正需要的信息呢?
专业检索一般采用逻辑法,目前各种计算机检索系统几乎都采用了这种方法,这种检索方法一般是通过逻辑运算的布尔表达式来表示的, 包括逻辑算符“ 与A N D ”、“或O R ”、“非N O T ”,下面介绍的几种方法都基于逻辑法。
1 、积木法。类似于搭积木一样,把一个检索课题分成若干部分,先对各个部分进行检索,然后再进行组配,每一部分相当于各个积木,最后把搭建的积木拼成图案,这样可以把所查文献与检索课题进行比较。其优点是能够比较清楚地提供检索逻辑式,以便以后回顾和进行检索式的保留与调用。其缺点是耗费较多的存储容量和联机时间。在积木法的实施过程中,宜将最专指的组面和最少文献登录数的组面优先处理,以便缩短计算机的匹配时间。
例如:要检索“热水器内胆防护用钛纳米涂料”,可以组成两个积木块,即钛纳米涂料,热水器内胆防护涂料,然后把二者组合。
2 、引文索引法。即从最专业的检索词开始,查出少量文献,然后然后检查这些文献中使用的标引词和自由词,选择其中重要的纳入修改后的检索式中,再进行检索,如此循环,使被检文献量逐步增长,直到取得满意结果为止。这种检索方法的特点是利用联机系统的交互能力,以动态的、实验性的方法去导出合适的检索式。其缺点是检索者的浏览与思考过程会耗费较长的联机时间。
例如:要检索“高层建筑无水箱直连供暖系统”,可以用比较专业的词“ 无水箱直连供暖系统”检索,检索到相关文献后,其文献中也有用“高层建筑”与“分区供暖” 或“ 高层建筑” 和“ 供暖系统连接方式”进行表述的,因而也可以用其进行检索。
3 、逐步递进法。即先是大范围检索,比较粗泛,得到的文献规模比较大,然后再用其他条件加以限制,例如文献出版年份、文种、文献类型以及最专指的概念组的叙词等,以逻辑的方式对原来的命中文献集合进行缩小,逐次分割,类似剥笋一样,逐步逼近核心部分,从而获得一个可以接受的文献集合。这种方法在专业检索中比较常用,其优点是漏检较少,可以随时根据文献量的多少而灵活掌握限制条件,检索比较主动。缺点是需耗费较多的机时。
例如:要检索“全水聚氨酯硬质泡沫组合聚醚”, 首先确定比较大的概念“ 聚醚”, 然后用“ 硬质泡沫” 限制, 这种泡沫又必须是“聚氨酯硬质泡沫”,而且是“ 全水” 的。
4 、排除法。有时候在中,我们会遇到这种情况:所有的关键词都用上了,而且不能再进行限制,但命中文献数量还是不能令用户满意,这时不防使用排除法,即除了某某概念之外的所有记录命中,专业数据库中都设有这一检索方式,但一般不提倡。
在实际课题检索过程中,并非只是某一方法的单独使用,有时是几种方法兼而用之。下面用两个检索实例来加以说明。
例1 课题《舰载高频自适应技术》——短波通信鞭天线根部调协器
本课题所要求查询的是一种天线调协器(或天线匹配器),且这种调协器是根部调协器,强调的是采用了频率预置必须是宽带频率预置,用于大功率短波通讯中。
首先对课题进行分析:
(1)确定范围:天线调协器OR 天线匹配器
( 2 )限制条件:根部调协器
( 3 )技术关键:频率预置O R 预置频率
(4)关键技术需要说明的情况:宽带频率预置,且是大功率通
从上述分析中可以看出,“ 天线调协器”或“天线匹配器”是一个很专业的概念,把它作为关键词,检索之后命中的文献适中,但人工排查还有些困难,因而加入限制条件。限制条件选取短波通讯还是根部调协器?短波通讯是应用范围,而根部调协器是应用部位,如果是一种应用范围很窄的课题,我们一般是选取范围的,而对于应用很宽的课题项目,就不应把范围作为检索词,因为这样容易漏掉很多这一范围应用而又未提及这一词的研究项目;关键技术“频率预置”有同一说法即“ 预置频率”;关键技术需要说明的情况是宽带且大功率,从上述分析我们不难看出,其中即有“引文索引法”( 选取专业概念), 又有“ 逐步递进法”( 限制条件的选取)。
经过上述分析,最后确定的检索词为:
①(天线 A N D 调协器)O R (天线A N D 匹配器)
② 根部
③(频率# 预置)O R (预置# 频率)
④ 宽带
⑤ 大功率
关键词确定了, 剩下的就是检索策略了。按用户要求最理想的检索策略应该是:
⑴.① AND ② A N D ③ A N D ④A N D ⑤
其次是:
⑵.① AND ② AND ④ AND ⑤结果检索过程中我们在策略⑴和⑵中均未查到相关文献, 这时应采用“ 积木法”,对课题进行放宽检索,即采用检索策略:
⑶ ① AND ② AND ( ④ OR ⑤)
结果命中2 篇相关文献,且与用户所查课题具有可比性。
例2 课题《桑蚕丝食用保健研究》
本课题用户要求查询有关柞蚕丝及丝素、丝胶的保健作用的研究和产品。按照课题要求我们确定检索词为:
①桑蚕丝 OR 桑蚕丝素 OR 桑蚕丝胶OR 丝蛋白 OR 丝多肽
②保健
③食用
检索策略为:① AND (② OR ③)
但没查到相关文献。通过分析得知,如果是对桑蚕的研究,一般是不提“桑蚕”两个字的,这时我们采用了排除法检索。检索词①改为蚕丝 OR 蚕丝素 OR 蚕丝胶OR 丝蛋白 OR 丝多肽,另外再加一个④柞蚕,策略改为(① A N D (② O R③))N O T ④,即检索除了柞蚕之外的所有“蚕丝、蚕丝素、蚕丝胶、丝蛋白、丝多肽”的保健或食用方面的研究文献,然后进行人工浏览排查。此例中不使用N O T 这一逻辑语句,就必须对检索结果进行逐一阅览,看是桑蚕还是柞蚕方面的研究,所以虽然“N O T ”这个逻辑检索词在检索过程中不提倡用,但在排除一些无用记录或需特殊处理的检索过程中,“N O T ”的作用是相当出色的。
江舒
来源:中国科技信息 2005年第16期