829-信息检索教程【考点汇总】

信息

广义的信息指自然界和一切人类活动所传达出来的信号和消息,是事物表现的一种普遍形式。
狭义的信息指经过搜集、记录、处理和存储的可供检索的文献、数据和事实。它是人类对客观事物的认识,是实践经验的总结,是认识的结果,是我们检索的对象。

机读型信息

通过编码和程序设计,以机器语言存储在磁盘、光盘等介质上,并依赖计算机输出的信息。

零次、一次、二次、三次信息

零次信息指在人际交流中口头携带和传播的信息
一次信息指未经过加工或粗加工的原始信息资源,也称原始信息,是人们在社会实践活动中直接产生或得到的各种数据、概念、知识、经验及总结。
二次信息是以一次信息为依据进行加工整理而形成的信息,是对一次信息浓缩或有序化的产物
三次信息是在对零次信息、一次信息、二次信息进行分析研究、加工提炼和概括综合而形成的信息。

综述

即综合性叙述,将大量分散的有关特定课题的文献、事实和数据进行归纳、分析、综合、筛选,以简练的文字扼要叙述出来,内容十分概括。

述评

指针对某一学科或某一问题,全面系统地总结各种情况、观点和数据,并给予精辟的分析评价,“有述有评”是述评最为突出的特点。

正式出版信息和非正式出版信息

正式出版信息是指公开出版发行的信息。包括图书期刊报纸等
非正式出版信息,也有人把它称为灰色文献,指不经过公开出版物流通渠道、不大量发行、为一部分用户使用的内部文献信息资料。

科技报告

报道(记录)研究工作和开发调查工作的成果或进展情况的一种文献类型。

档案

国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动直接形成的具有保存价值的各种文字、图表、声像等不同形式的历史记录。

专利和标准文献

专利文献:是实行专利制度的国家及国际性专利组织在审批专利的过程中产生的官方文件及其出版物的总称。
标准文献:记录技术标准、管理标准和其他具有标准性质的文件的文献形式。
10.书目、索引、文摘
书目:是图书或报刊目录的简称,著录和揭示一批相关文献,按一定的次序编排而成,是一种登记、报道和宣传文献的检索工具。
索引:把一种或多种文献中具有检索意义的内容摘录下来,按一定顺序加以编排并注明出处以供查检的工具。
文摘:以简明扼要的文字对文献原文的摘述。
11.期刊
又名杂志,是一种有固定的名称,统一的版面形式,按期出版,标有刊期等序号的连续出版物。
12.连续出版物
具有统一题名、印有编号或或年月顺序号、定期或不定期地在无限期内连续出版、发行的出版物。包括期刊、报纸、年鉴、年刊、指南、学会报告丛刊等。
13.信息检索
广义:包含信息存储和信息获取两个过程。信息存储指通过对大量无序信息的选择和收集著录和标引等方法,建成各种各样的信息检索工具或信息检索系统,使之成为有序化信息集合的过程。信息获取是存储的逆过程,其实质是根据特定的需求,运用已组织好的检索系统,将特定的信息查找出来。
狭义:即信息获取过程,指通过一定的方法,从一存储的信息中检索出与用户提问相关的文献、数据和事实的过程,即根据用户的特定要求查找所需信息的过程。
13.信息检索系统
指依据特定的信息需求建立起来的一种有关信息搜集、加工、存储和检索的程序化系统,其主要目的是为人们提供信息服务。
14.数据库、参考数据库、源数据库、全文数据库
数据库:是至少由一个文档构成,并能满足其某一特定目的的或某一特定数据处理系统需要的一种数据集合,通俗的讲,数据库即在计算机存储设备上按一定方式存储的相互关联的数据集合。
参考数据库:为用户提供信息线索的数据库,它可以指引用户获取原始信息。
源数据库:指能直接提供原始资料或具体数据的数据库。
全文数据库:存储文献全文或其中的主要部分的源数据库。
15题录
揭示和报道单篇文献的题名、作者、出版地、时间、主题词、分类号等文献特征的集合。
16.信息检索效果
利用检索系统开展检索服务时产生的有效结果。
17.查全率、查准率、漏检率、误检率和响应时间
查全率=检出相关文献信息量/检索系统中相关文献信息总量
查准率=检出相关文献信息量/检出文献信息总量
漏检率=漏检相关文献信息量/检索系统中相关文献信息总量
误检率=误检文献信息量/检出文献信息总量
响应时间:在一次检索过程中,用户从开始向信息检索系统提问到系统输出检索结果的全部时间。
18.检索语言
检索语言实质上是用于表达一系列概括文献信息内容的概念及其相互关系的概念标识系统。检索语言由词汇和语法组成。
检索语言有广义和狭义之分。
广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。人工语言是根据一定的规则人为编制而成的检索语言,它有着严格的使用规则,可用于表述文献主要内容,建立信息检索系统。自然语言是人类交流时使用的语言,不受任何限制,未经加工和规范。
狭义的检索语言仅指根据信息检索的需要,按照一定的规则对自然语言进行规范,并专门用于信息标引和用户检索的人工语言。
19. 分类语言、主题语言、代码语言和引文语言
分类语言:用分类号来表达各种概念,将各种概念按学科性质进行分类和系统安排。分类语言包括等级体系分类语言(体系分类法)和分析—综合分类语言(组配分类法)。它们统称为分类法系统。
主题语言:是采用表达某一事物或概念的名词术语,用于标引、存储、检索的一种检索语言。它包括标题词语言(标题法)、单元词语言(单元词法)、叙词语言(叙词法)和关键词语言(关键词法)等。这些可统称为主题法系统。
代码语言:一般只是就事物的某一方面特征,用某种代码系统来加以标引和排列。例如,化合物的分子式索引系统、环状化合物的环系索引系统、有机化合物的威斯韦塞尔线型标注法代码系统等。
引文语言:是利用文献之间的相互引证关系而建立的一种自然语言,其标引词来自文献的主要著录项目。它具有选词方便、词汇丰富等特点。这种方法提供了从被引论文来检索引用它的全部论文的途径,从而顺着一种科学思想的发展过程线索找到有关信息。可以将引文语言看作是检索语言的一种特殊类型。
20.参照系统
主题法系统各种语言显示概念之间关系的一种方法,其功能是将具有相关性但因为按字顺排列而被分散在各处的概念联系起来,参照系统可以显示事物概念之间的全部等同关系、一部分等级关系和全部相关关系。
21.轮排聚类法和范畴聚类法
轮排聚类法:是将表达复杂概念或者多因素主题的标识,按他们所表达出来的每个具有检索意义的概念因素或主题因素进行轮排,当某一概念因素或主题因素轮排到检索入口位置时,就能使具有同一概念因素或主题因素的概念或主题的标识排到一起,从而起到聚类作用,显露出概念之间的相关性。
范畴聚类法:可以表明同一范畴的检索词都属于某一学科或专业范围 。
22.先组式语言、后组式语言和散组式语言
先组式语言:指表达信息主题概念的标识在编制词表时就已固定组配好,信息存储和检索人员在标引和查找信息时,依据词表选用组配好的主题标识进行操作,典型的先组式语言有体系分类法和标题词法。
后组式语言:指在词表编制和标引信息时不规定表主题标识的组配关系,在检索时再根据需要将各个标识进行组配,来表达较为复杂的主题概念。
散组式语言:是指对于复杂的主题标识,在词表中不组配,而是在标引阶段将表达主题概念的若干个标识根据一定的规则,组配在一起的检索语言。
23.文献分类
根据文献所载信息的学科属性,对文献进行类别划分,并进一步根据文献信息内容之间的内在关系,组织成科学的分类体系。学科分类是文献分类的基础。
24.分类检索语言和主题检索语言
分类检索语言:也称分类法,是将许多类目根据一定的原则组织起来,通过标记符号(分类号来代表各级类目和固定其先后次序的分类体系。
主题检索语言:又称主题法,它采用语词直接作为文献主题标识,按字顺排列主题标识,提供各种检索词语的途径。它从描述事物的特性角度出发,按文献所论述的事物(即主题ÿ

  • 6
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值