信息组织川大972 | 第七章核心知识点


1. 自由标引

  自由标引即人工关键词标引,是由标引人员在对文献内容进行分析之后,按一定的规则,将文献原文所用的,能描述文献内容主题的那些具有关键性意义的词抽出,不加规范或只做少量规范化处理,按字顺排列,以提供检索途径的方法。

  优点在于标引速度快;成本低;可保证较高的查准率。

2. 自动主题标引

  自动标引,指利用计算机从各种文献中自动提取相关标识引导的过程。

3. 自然语言检索系统与自然语言检索

3.1 自然语言检索系统

  自然语言检索系统是指对文献作者或文摘提要的编写者原来使用的语言进行一定的序化组织、处理并提供自然语言检索接口供用户查询使用的检索系统。

3.2 全文检索

  全文检索是指以全部文本信息作为检索对象的一种信息检索技术。

特点
(1)允许用户使用自然语言检索
(2)允许用户从全文的任意章、节、句、字中检索
(3)能直接获取原文

优点
(1)避免了自动索引过程中的不准确和选词问题
(2)词汇自然更新
(3)有效地克服误组配,查全率较高
(4)可以达到任意专指度
(5)用户可以直接浏览文献全文,利于实现反馈检索

3.3 自然语言检索系统的优点及不足

(一)优点
  1、降低标引难度及成本,实现无标引检索,提供标引速度,缩短时差
  2、直接使用文献用语和作者用语标引和检索,能客观反映文献本身的主题内容,提高检索专指度
  3、采用用户熟悉的自然语言,符合用户检索习惯,减少了概念转换过程中产生的失真现象
  4、采用自动处理方式,检索入口词多,有利于提高检全率
  5、自然语言检索操作简单方便、灵活、扩大了用户面
(二)不足
  1、易造成主题相关的信息分散
  2、词间关系含糊不清或不正确,无法清除显示概念间的关系,易造成检索系统的失误
  3、用户难以确定全部的检索用词,加重了用户负担
(三)问题的症结
  1、意义相近或相似的字词影响查全率和查准率
  2、自然语言检索采用基于全文匹配检索的方法,而非基于主题概念的方式,导致信息噪音

4. 后控制检索

4.1 后控词表

  后控制词表是对自然语言中大量存在的等同关系、等级关系和大部分相关关系进行控制和揭示,具有自学习功能,可根据检索的需要将新概念和新术语及时地加入词表中,是一个动态词表


信息组织知识点全系列索引

第一章 绪论
第二章 信息组织的基本原理
第三章 信息组织分类法
第四章 信息组织主题法
第五章 信息组织集成法
第六章 信息内容分析与标引
第七章 信息组织中的自然语言应用
第八章 网络信息组织
第九章 数字图书馆信息组织
第十章 信息组织的历史发展和未来趋向

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

是希望

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值