信息组织|网络信息组织

1 网络信息环境

Web发展阶段

  1. Web 1.0文档的网络
  2. Web 2.0用户参与创造的互动网络
  3. Web 3.0语义网(数据的网络)

文档网络是基础,互动网络是主流,语义网络是趋势

网络信息组织的挑战

  1. 开放无序
  2. 海量数据
  3. 碎片化关联化
  4. 用户需求差异化

网络信息组织的目标与任务

  1. 经典信息组织方法的网络化应用
      应用拓展——网络信息架构
  2. 新兴网络组织方法与技术创新
      兼容并包——语义工具

  结构是内核,搜索发现是目的。

2 传统情报检索语言的网络化改造与应用

2.1 分类法的网络化发展与应用

(一)分类法自身的网络化发展
  分类法载体大体经历了纸版、光盘版、网络版三个主要阶段

(二)分类法的网络化应用

网络信息使用环境的两个特点:

  1. 网络用户大多数是非硏究型专业用户;
  2. 网络资源除了学术资源之外,有更广泛的主题覆盖;

网络分类类目划分原则:

  1. "主题为主,学科为辅〃的设类原则
  2. 辅以扁平化、多维划分、多重列类、交叉参照等方式克服等级体系划分中的单一路径局限。

网络分类目录存在的问题:
  类目设置的随意性、资源归类的不合理性、编辑人员专业技能层次不齐、商业盈利驱动的不公平性、缺乏科学规范化控制等,导致网络分类目录整体质量和用户检索满意度下降。

2.2 叙词表自身的网络化发展

(一)叙词表自身的网络化发展
  叙词表自身网络化发展与作为检索系统内部的 后控词表是并行发展的。
(二)基于传统情报检索语言的术语网络服务
1. 术语网络服务的要素辨析
受控词表(规范控制)、概念与术语(核心要素)
2. 术语网络服务定义
JISC报告的定义:
  JISC报告中对术语网络服务的定义较为全面,列举出面向机器和用户的检索、浏览、发现、翻译、映射、语义推理、主题标引和分类、获取、提醒等各类服务。

  1. 术语网络服务设计与实现
    ■第一阶段:
      基于词表的整体(Scheme )层次,提供各种词表的元数据描述和使用统计等相关描述。
    ■第二阶段:
      跨词表的基于术语层次的概念语义揭示与检索服务,包括单个概念主题的检索与关联发现,术语网络浏览,术语编辑与修订,提供特定应用需求的术语集合等。
    ■第三阶段:
      在前两层的基础上以概念、术语、语义层次的规范结构 化机制对外向第三方应用提供服务。具体应用领域包括 :自动分类与索引、命名实体识别、计算机辅助翻译与自动翻译、查询扩展与限定、语义推理等

3 语义网信息组织

(一)语义网(Semantic Web )
  是对现有网络的扩展,信息拥有良好结构定义的涵义(well-defined meaning ),促进更好的人机协同工作。智能代理Agent通过对分布式异构网络的有效访问和检索,从中抽取、组合、加工所需情报,帮助用户寻找解决方案,提高办事效率以及贴心提醒服务等近似科幻情景,向大众描绘了语义网实现的美好愿景。

(二)语义网技术架构
http://eiKwikipedia.org/wiki/Semantic_Web
纵观语义网技术架构,目前研究重点集中在第三层到第六层。
■第三层涉及RDF资源的描述与发布共享研究;
■第四层是RDFS词汇集的映射与互操作研究;
■第五层是本体构建与检索利用研究;
■第六层是基于本体的语义推理研究等。 第七层和第八层目前还没有实现。

3.1 本体模型

(―) 本体的涵义及作用

  1. 概念(Concept)
      也被称为类Class ,领域内所有专指概念,采用面向 对象思想,拥有相同属性的一类对象的集合。对概念进行层次梳理形成本体骨架(Taxonomy )。本体的概念与之前提到的受控词表概念空间的道理相同。
  2. 实例(Instance )
      是特定概念类之下的具体实体。例如:若“狗”是一 个概念类,那么“哈士奇”就是"狗”这个概念的一个实例。根据本体建模特定需要,同一领域本体的概念类与实例划分可能不同。
  3. 关系(Relation )
      指领域内概念、属性、实例之间的交互 (interaction)明确化定义。本体中常见的语义关系有整体与部分关系Part-of、等价关系sameAs、继承关系kind-of、概念与实例关系is-a等。
  4. 函数(Function )
      是一类特殊的关系。在关系上附加约束条件,可唯 一确定函数取值。
  5. 公理(Axiom )
      也称为断言(Assertion)作用在概念和属性上的规 则,实现语义推理的基础。

本体的作用

  1. 概念描述:通过概念描述揭示领域知识;
  2. 语义揭示:本体具有比RDF/RDFS更强的表达能力, 可揭示更丰富的语义关系;
  3. 一致性:本体作为领域知识的明确规范,可以保证语义的一致性,从而彻底解决一词多义、多词一义和词义含糊现象;
  4. 推理支持:本体在概念描述上的确定性及其强大的语义揭示能力在数据层面有力地保证了推理的有效性。

(二)本体的类型
1.按照本体的领域依赖程度与侧重分:
  顶层本体、领域本体、任务本体、应用本体
2 .按照本体的形式化程度分:完全非形式化本体、 结构非形式化本体、半形式化本体、完全形式化本体

(三) 本体的构建方法
本体构建原则(Thomas Gruber本体设计的五个原则):

  1. 明确性(clarity):本体中的概念应有客观、明确的形式化定义。
  2. —致性(completeness):概念定义本身与其推理之间是相容的公理在逻辑上一致。
  3. 可扩展性(extendibility):本体是一个动态演变的有机体,具有共享和被复用修改的扩展性。
  4. 最小编码偏好(minimal encoding bias):本体的概念体系应建立在知识层面,不要过于强调符号层面的处理。
  5. 最小本体承诺(minimal ontological commitment):本体建模过程中尽可能减少约束声明,方便未来跨领域跨系统的共享。

本体构建步骤
①确定本体的领域和范围。
②考虑重用已有本体。不要重新发明轮子,善用已有相关本体与词表素材资源。
③罗列领域内的重要概念。
④定义概念及概念体系。这一歩主要是分类结构的建立,可采用自上而下、自下而上或两者相结合的方式。
⑤定义概念的属性(slot,槽值)。这一步强调语义属性的建立。
定义属性的分面(facet)。包括取值类型、取值的基数限定(candidates )、定义域与值域等。
⑦创建实例(Instance)。根据概念类添加具体的实例,通过类的继承关系。

(三) 语义网形式化表征语言
OWL是本体表征的终极理想语言;
  基于RDF的各种应用是当前适应资源表征的中级形式化语言,具有一定的语义表达能力,但语义丰富度和推理规则较弱。
(四)关联数据
■关联数据的定义:
  关联数据不是一种具体的语义网技术,而是基于 RDF模型,采用URI命名网络对象,通过HTTP协议进行网络数据发布和资源关联检索发现。

关联数据的发布原则
(1)使用URI作为网络上任何事物的标识名称;
(2)使用HTTP URIs让任何人都可以访问到;
(3)当有人访问某个标识名称时,提供有用的信息;
(4)尽可能提供相关的URI,以便人们可以发现更多的事物。

4 网站信息架构

(—)信息架构的内涵
  信息架构(Information Architecture , IA )是组织和设计信息空间结构的一门艺术与科学。这 一专有名词是由美国建筑师理查德•沃尔曼( Richard Wurman )先生于1975年提出的。

(二)信息架构三圏图
强调人,信息以及人与信息环境的相互作用。

  1. 用户涵盖其服务的受众、需求、任务与搜寻行为、体验 效果等;
  2. 内容涵盖资源对象,属性与结构等;
  3. 情境指目标、技术环境、资源限制、政治文化影响等。

  一个好的信息架构设计必须重视用户的需求与搜寻行为,把控网站内容的质量与数量,切合目标与愿景,具有较好的环境适应性与动态变化性。

(三)网站信息架构剖析
  好的信息架构是无形的,用户只关注到他们的信息查找与问题求解,顺利愉快地完成任务,不会迷失找寻方向和遇到难以理解的障碍,这就是好的信息架构。
在这里插入图片描述

  1. 组织系统
      以精确与模糊的组织方法为指导原则,大型网站组织系统中主要采用等级分类法与分面分类法两种。
  2. 标识系统
      元数据描述 同义词环 规范文档 叙词表
  3. 导航系统
      是在组织系统搭建的信息空间结构中,提供辅助浏览与定位功能,并通过标识系统与用户交互。与盖房子类比,组织系统是建造房子的主体框架,导航则是增加门窗。
  4. 搜索系统
      是指关键词搜索,知道要找什么,将需求表达为关键词, 提交到搜索引擎得到相关信息。

5 Web2.0信息组织方法

Web2.0

  1. 强调以人为中心,发动群体智慧,在用户参与内容组织的过 程中形成人与人的联系和互动。
  2. 网络信息资源组织的主体已经由专业网站扩展到个体用户, 从专业组织的制度化、把关式的模式扩展为更多"自组织” 的个性化描述和组织形式。

标签法Tagging
  标签法产生的大量标签集合以及基于资源链接的主题 相关性产生的语义关系最终组成一个扁平松散式的体系结构
维基wiki
集成融汇Mashup

6 参考资料

《信息组织》第三版 戴维民主编 高等教育出版社 2014年
《信息组织》第八章 PPT

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

是希望

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值