【829】【02检索语言】【理解】


信息检索比较偏

【一】 检索语言的含义

(什么是检索语言)(18华师简答)

检索语言:广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言人工语言是根据一定的规则认为编制而成的检索语言,它有严格的使用规则,可用于表述文献的主要内容,建立信息检索系统。自然语言是人类交流时使用的语言,不受任何限制,未经加工和规范。狭义的检索语言是指根据信息检索需要,按照一定的规则对自然语言进行规范,并专门用于信息标引和用户检索的人工语言
在这里插入图片描述

传统意义上的检索语言——根据信息检索需要而创制的人工语言
广义的检索语言泛指——信息检索过程中涉及人工语言和自然语言
狭义的检索语言——仅指根据信息检索的需要,按照一定的规则对自然语言进行规范,并专门用于信息标引和用户检索的人工语言

人工语言是根据一定的规则人为编制而成的检索语言,可用于表述文献主要的内容,建立信息检索系统。
自然语言人类交流时使用的语言,不受任何限制,未经加工和规范,更符合用户的日常表达习惯。

检索语言的特点

作为沟通信息标引与信息检索两个过程而编制的人工语言,检索语言不但能够保证不同的标引人员描述信息特征的一致性,而且能够保证检索提问标识与信息特征标识的一致性
与其他语言相比,检索语言突出的特点是:
①具有必要的语义和语法规则,能准确地表达科学技术领域中的人和标引和提问的中心内容和主题;
②具有表达概念的唯一性,即同一概念不允许有多重表达方式,不能模棱两可;
③具有检索标识和提问特征进行比较和识别的方便性;
④既适用于手工检索系统,也适用于计算机检索系统。

检索语言的功能

在这里插入图片描述
(1)标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性
信息标引是一个群体行为,只有共同依据检索语言,才能保证标引信息的一致性。

(2)对内容相同及相关的文献信息加以集中或揭示其相关性
检索语言采用等级结构、参照系统、轮排聚类法、范畴聚类法等显示概念之间关系的方法,来实现此功能。

(3)使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行有序化检索
检索语言将表达成千上万个信息主体概念的全部信息标识排列成一个有序的系统。
排列信息标识的方法包括:分类排列法,字顺排列法,分类和字顺结合的排列法

(4)便于将标引用语和检索用语进行相符性比较:一般来说,任何一种检索语言都有便于将标引用语和检索用语整体上进行相符性比较(即判断标引用语是否与检索用语完全相符)的功能。大部分检索语言还可以将标引用语和检索用语从局部上进行相符性比较(即判断标引用语是否与检索用语局部相符)。

检索语言的功能/性能

(2006年简答)
(1)标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性
(2)对内容相同及相关的文献信息加以集中或揭示其相关性
(3)使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行有序化检索
(4)便于将标引用语检索用语进行相符性比较

检索语言的分类

(1)按描述文献的特征(文献外表特征和文献内容特征)

在这里插入图片描述
文献外表特征——以文献的篇名(题目)、作者姓名、出版者、合同号、报告号、引文等,据此作为文献标识和检索依据而形成的检索语言成为描述文献外表特征的检索语言,如题名索引,著者索引、报告号索引、合同号索引、存取号索引、引文索引等。

描述文献内容特征的检索语言(分类语言、主题语言和代码语言)

(2)按结构或原理(分类语言、主题语言、代码语言和引文语言)
在这里插入图片描述
分类语言,用分类号来表达各种概念,将各种概念按学科性质进行分类和系统编排,包括等级体系分类语言(体系分类法)分析——综合分类语言(组配分类法),它们统称为分类法系统。

主题语言是采用表达某一事物或概念的名词术语,用于标引、存储、检索的一种检索语言。包括标题词语言、单元词语言、叙词语言和关键词语言等,可统称为主题法系统。

代码语言一般只是就事物的某一方面特征,用某种代码系统来加以标引和排列。

引文语言是利用文献之间的相互引证关系而建立的一种自然语言,其标引词来自文献的主要著录项目。

(3)按信息标识的组合使用方法(先组式语言、后组式语言和散组式语言)
在这里插入图片描述

先组式语言表达信息主题概念的标识在编制词表时就已固定组配好,信息存储和检索人员在标引和查找信息时,依据词表选用组配好的主题标识进行操作。

  • 典型的先组式语言有体系分类法和标题词法
  • 先组式语言标识明确,系统性较好,适用于传统的文献单元方式的目录索引。但是表达专指概念和新概念较困难,灵活性较差,容易造成词表体积庞大,检索途径少。

后组式语言指在词表编制和标引信息时不规定表达主题标识的组配关系,在检索时再根据需要将各个标识进行组配,来表达较为复杂的主题概念。

  • 比较典型的后组式语言有叙词语言和单元词语言
  • 后组式语言能够以较少的词语来表达较多的概念和较为专指的概念,可以比较及时地表达新概念,概念容纳能力强。同时,可以实现概念的多向成族,多途径检索,能够灵活地扩大和缩小检索范围,因此其检索的灵活性好。采用后组式语言所编制的词表体积相对较小。但是编制和使用的难度较大,组配语义的明确性较差。

散组式语言是指对于复杂的主题标识,在词表中不组配,而是在标引阶段将表达主题概念的若干个标识,根据一定的的规则组配在一起的检索语言,如**《冒号分类法》**。

  • 散组式语言的性能与其检索标识是否分段轮排有很大关系。如果检索标识能够分段轮排,散组式语言就兼有先组式和后组式语言的主要优点。如果检索标识不轮排,性能和先组式语言差不多,只是其专指概念和新概念表达能力有所增强。

(4)按语言的规范程度,可分为人工语言和自然语言
人工语言有主题法、分类法和某些代码等种类。
自然语言是直接取自文献信息本身,不经加工或规范的词语或句子。

(5)按包括的学科或专业范围(综合性检索语言、专业性检索语言和多学科检索语言)
(6)按所用语言文字(单语种检索语言和多语种检索语言)

【二】检索语言的理论基础

检索语言其主要理论基础有概念逻辑、知识分类和术语学

概念逻辑

在这里插入图片描述

检索语言不论是语词的还是符号的,都是表达一系列概括信息内容的概念及其相互关系的概念标识系统。
概念逻辑,是一种科学思维方法,通过明确各种概念及其相互关系而揭示事物的本质属性及各种事物之间的联系与区别。
检索语言在建立词汇、显示概念关系以及在文献标引和检索中,都离不开概念逻辑。概念是事物本质属性的概括。
任何概念都有其内涵与外延。

某一概念的内涵指其反映事物的本质属性;外延指其反映事物的范围,它们之间存在着反变关系

(1)概念间的关系:概念之间的关系,按其外延是否有相同部分,可归结为相容关系与不相容关系
如果两个概念的外延至少有一部分相重合,则两者之间是相容关系;如果两个概念的外延没有相重合的部分,则两者之间是不相容关系。

在相容关系中可以分为同一关系、属种关系、交叉关系、整体与部分关系、全面与某一方面关系、不相排斥的并列关系。在不相容关系中包括互相排斥的并列关系、矛盾关系和对立关系。

(2)概念逻辑方法:检索语言在表达各种概念及其相关关系时,普遍地应用了概念逻辑的原理,有效地利用了“概念的划分与概括”和“概念的分析与综合”这两种逻辑方法来建立自己的结构体系。

概念的划分与概括(分类):即利用概念内涵由反映事物本质属性的概念因素构成,概念因素的增加或减少可以形成新的概念,概念内涵与外延成反变关系等性质,对概念进行划分(缩小)或概括(扩大),形成更为专指或更为泛指的新概念,用以区别客观世界千差万别的事物,并利用划分或概括过程中所产生的概念隶属关系和并列关系,建立某种形式的检索语言结构体系,即概念等级体系,用以显示客观世界千差万别的事物之间的内在联系。
这种结构具有很好的系统性。例如,体系分类法就是应用此种逻辑方法的典型。

概念的分析与综合(组配):即利用在概念的交叉关系中两个概念外延的相同部分可以形成一个新概念,其内涵等于原来两个概念内涵之和,并且它与原来的两个概念具有隶属关系的这种性质,进一步发展为将一个内涵较深的概念分解为两个或两个以上内涵较浅的概念的一种概念逻辑方法,用以建立另一些形式的检索语言结构体系,即概念组配体系。

这种结构体系可以提供从多种途径来进行信息检索的功能,而且可以任意选择检索标识的专指度,根据实际需要扩大、缩小或改变检索的范围。例如,叙词语言与组配分类法便是应用概念分析与综合的典型。

知识分类

在这里插入图片描述
知识分类是对千差万别的事物做系统研究的重要方法,是对各种事物之间的区别和联系从本质上、原理上进行揭示的重要手段,对信息的系统化具有重要的价值,其实质是划分知识单元、组织知识体系,包括学科分类和事物分类

学科分类是以信息的学科属性为分类标准,根据各门学科的区别和联系,对学科进行区分和组织,确定每门学科在科学整体中的位置,揭示科学的内部结构,建立符合科学发展规律的分类体系。
事物分类是根据事物属性的异同将事物划分成类,构成事物分类体系。

学科分类是知识分类的主题,事物分类是知识分类的基础。

知识分类应当遵循的两条基本原则是客观性和发展性
客观性原则即对学科或事物进行划分和组织时,应依据知识对象固有的、客观存在的区别和联系。
发展性原则是指知识分类应按照学科或事物的发展规律,将知识对象由低级到高级、由简单到复杂进行划分和组织。

术语学

在这里插入图片描述
术语是在特定学科领域用来表示概念的称谓的集合

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值