相关文献
随着计算机技术的发展,文献检索系统中的自动标引技术也不断提高,其中,基于汉语的自动标引技术是现今国内外图书情报专家研究的热点,提出了许多方案。笔者通过长期的观察和实践,认为建立科学、有效的抽词词典是研究自动标引技术的关键。1 抽词词典的建立与类型抽词词典的建立是自动标引的基础,其质量的高低直接影响文献自动抽词的效果,正如著名专家张琪玉教授所说的:“近2 0年来,我国学者对汉语自动分词技术提出了不少解决方案,有些还通过了鉴定,但见于实际应用的并不多。这并不是说这些经不住时间考验,而主要是因为系统半途而废。如果只有软件而不编制抽词词表,那么事情只完成了很少的一部分,因为编制抽词词表要比编制抽词软件需要许多的工作量,目前需求大量高质量的各类型的语言抽词词表”。现今已经研制成功的抽词词表主要有:1 1 停用词表用来对文献内容进行分析和关键词的切分,从而清除非标引用词。1 2 特例词表将有可能被停用词表筛漏的特指词选择出来,当作标引用...
(本文共2页)
阅读全文>>
某些由受控标引生成的计算机化文献数据检索系统,如AGRIS(国际农业科技情报体系)数据库的文献数据输入过程中,文献标引人员在依据主题词表选用主题词对文献进行主题标引时,系统本身可籍助上位自动登录功能,自动将所有人工赋予的主题词其所在字块中凡有的上位主题词,包括族首词在内,悉数无遗漏地一一登录,并贮存于计算机检索系统中,与人工赋予的主题词一道,随时供文献检索之用。而被自动登录在案的上位主题词并不挤占标引规则对人工标引词数规定的限额。下边就分别对上位自动登录在文献主题标引及文献检索实际业务操作中的意义作一些讨论。1上位自动登录功能对文献标引业务操作的影响1.1对于使用主题词表,由受控标引生成,且具备上位自动登录功能的这一类型文献数据库,如AGRIS文献数据库来说,为其输入文献数据,进行主题标引的做法是:根据文献涉及的主题概念,在相应主题词表中物色出能最精确表述有关主题概念的主题词,对文献进行标引,而无需虑及文献检索人员的扩检需要,再...
(本文共2页)
阅读全文>>