文章目录
1 我国古代的信息组织及其特点
古代信息组织活动处于初始阶段,呈现出以下特征:
- 以信息的揭示、存储为基本目的;
- 最早形式的目录和藏书组织的着眼点不在于"用 “而在于"管”
- 信息组织对象主要是文献;
- 信息揭示、组织的方法主要是对信息的记录和分类, 着重信息外在特征的记录和描述,体现为清册职能;
- 操作完全由个人以手工方式进行,简单且无一定标准 和规范;
- 信息组织的代表性成果是目录。
2 近代国外信息组织及其特点
- 近代信息组织的活动除围绕着文献的保存开展外,开始重视对信息外在特征和内容特征的全面描述、揭示。
- 体系分类法的确立。
- 主题法的研究和应用。确立了主题法原则,而且有了完整的主题 词表和达到一定水平的主题揭示活动。
- 索引、文摘的发展说明信息组织从载体单元到内涵单元的深化。
- 信息组织技术方法的进步。分类法与主题法的编制技术更趋科学 、完善。
3 分类法的改造、主题法的发展、分类主题一体化、自然语言
3.1 分类法的改造
- 1906年,英国的布朗(J.D.Brown )在《主题分类法》中采用了 主题分析法和组合原则,成为分面分类法的萌芽。
- 1933年,印度图书馆学家阮冈纳赞(S.R.Ranganathan )编制了世界上第一部分面组配式分类法——《冒号分类法》,并系统 提出了分面分类理论。在其影响下,一系列专业分面类表问世。 传统分类法被不断地增加分面组配成分,朝分面组配方向改造。
3.2 主题法的发展
- 1947—1950年间,美国的穆尔斯(C.N.Mooers )在研究组配分类法 的基础上,提出了一种新型主题法一叙词法,并创造了 “叙词”、“叙词法”, “情报检索”,"情报检索系统"等专门术语。
- 20世纪60年代,叙词语言吸收了标题法、单元词法、关键词法以及分类法等各种检索语言之长,逐步取代了元词法成为现代情报检索语言的主流。它以概念组配取代字面组配,并广泛揭示概念间关系,使文 献信息的揭示更加准确。
- 1959年美国杜邦公司编制了第一部叙词表。
- 20世纪70年代,我国开始大规模编制和使用主题法。1971年,航空部情报所编制使用的《航空科技资料主题表》第2版问世,成为我国的第一部叙词表。1979年岀版的《汉语主题词表》,成为世界上最大规模的叙词表。
3.3 分类主题一体化
- 1969年,英国学者艾奇逊(J.Aitchison )编制了世 界上第一部分类主题一体化的《分面叙词表》O o它将一部分面分类表与一部字顺叙词表结合起来,通过严格规范,使每一个词汇同时出现在分类 表与叙词表中,实现了两种检索语言的兼容。
- 在其影响下,英美等国陆续出版了一批分类主题 —体化词表,如《伦敦教育分类法(第二版)》 、《建筑工业叙词表》、《基础叙词表》等。
3.4 自然语言检索系统的探索和应用
- 20世纪50年代,卢恩(H.P.Luhn)在前人探索的基础上 ,将计算机用于关键词索引的编制。其后,各种直接以自然语言为标识的检索系统相继出现。
- 20世纪60年代初,美国匹兹堡大学健康法律中心率先建立起第一个全文检索系统一一LEXISO
4 网络信息资源组织
4.1 传统分类法和主题法网络适用性研究
USMARC—体化编目格式中特设了856字段,即电子地址及检索方式字段,通过它可实现书目记录与网络信息 资源的链接。
国际上几部著名的分类法如UDC , DDC , LCC , CLC等 都在谋求网络上的应用,并已取得相当进展。
主题法组织网络信息有着比分类法更突出的优势,一些 传统的叙词表被改造成联机叙词表,还有的将叙词表嵌 入数据库检索系统,充当检索系统的后控词表。
继分类法和主题法等传统工具之后,本体、主题地图、 专家系统等新型知识组织工具陆续出现,分类法、主题 法的网络化、本体化改造成为新的研究热点。
4.2 搜索引擎技术的发展
- 独立型搜索引擎
- 混合式搜索引擎
混合式搜索引擎:兼具检索型和目录型两种检索方式。 - 元搜索引擎
又称为多线程式搜索引擎,是指利用统一的检索界面, 实现对多个独立搜索引擎索引数据库进行检索,并将检 索结果以统一格式显示的网络检索工具。 - 分布式搜索引擎
分布式搜索引擎是根据地域、主题、IP地址及其它的划 分标准将全网分成若干个自治区域,在每个自治区域内设立一个检索服务器,而每个检索服务器由信息搜索机器人,索引搜索软件数据库和代理三部分组成。各个代理之间可以进行查询的重定向。
4.3 元数据的开发应用
1. 元数据在网络中起着对信息的描述,定位,管理作用。
2. 都柏林核心元数据集(Dublin Core , DC)是影响最大.使 用最为广泛元数据体系,现已成为解决互操作问题的元数据标准。
3. 众多元数据方案在实际运用中出现的元数据间的有效共享与互操作成为关注的课题。
4.4 语义网、本体研究
1998年,伯纳斯李提出了 "语义网"概念并在其后设计了 语义网的多层架构。
语义网研究成为热点,研究内容包括:知识的表现(如 XML )、知识之间关系的描述(如RDF )、机器可识别的 信息的集合(如Ontology)、智能体(Agents )等。 本体(Ontology)是语义网的关键技术,有关本体构建工具,本体表示语言,本体构建方法,本体应用等硏究成为热点。
语义网的瓶颈在本体,本体构建的瓶颈在于领域知识库的构建。
■传统知识组织工具(分类法、主题词表)是本体构建的基 础或是改造源,是一条捷径,兼容改造传统的叙词表、分 类表,研发知识本体、语义网络、主题图等语义工具成为 网络知识组织工具研发的方向。
■改造方法:
用XML Schema构建叙词标记语言,用RDFSchema表示叙词内容 和关系,用SKOS、DML+OIL. OWL表示叙词关系等。
5 现代信息组织的特点
- 信息组织的出发点充分考虑用户的需要和检索习惯。
- 多元化的信息资源组织。
信息组织对象由单纯的印刷型文献发展磁带、光盘、数据库、网络等 多媒体,信息组织内容更加广泛,从各种类型的数据发展到具有丰富内容的知识,形成了信息组织方式的多样性和多层次性。 - 检索语言的发展。
分面分类理论的提出,突破了传统列举式分类法的束缚,为信息组织方法提供了新的思路。
自动标引技术和分类、主题法在网络环境下的应用受到广泛关注。自然语言的研究和应用兴起。 - 现代信息技术的应用。
信息组织形式从数据结构发展到知识表示;信息以文件方式、数据库方式、主题树方式和超媒体方式组织。
网络信息资源的组织成为信息组织实践与理论研究的热点。
元数据技术、语义网本体技术、搜索引擎技术、数据库技术、信息挖 掘、推送技术等成为信息组织领域内倍受关注的课题。
6 信息组织的发展趋势
- 以用户需求为导向的信息组织
- 信息内容揭示深入化
- 信息组织方法集成化
- 信息组织技术智能化
- 信息组织系统兼容化与标准化
- 信息组织理论研究的拓展
- 积极应对大数据时代信息组织的挑战
参考资料
《信息组织》第三版 戴维民主编,高等教育出版社,2014年
《信息组织》第十章 PPT