DAMA数据管理知识体系(第9章 文件和内容管理)

  • 课本内容
    • 9.1 引言
      • 概要
        • 文件和内容管理是指针对存储在关系型数据库之外的数据和信息的采集、存储、访问和使用过程的管理[1]。它的重点在于保持文件和其他非结构化或半结构化信息的完整性,并使这些信息能够被访问。
      • 业务驱动因素
        • 法规遵从性要求
          • 法律法规要求组织保留某些活动的档案
        • 诉讼响应能力
        • 电子取证请求能力
          • 电子取证是查找可能作为法律诉讼证据的电子档案的过程
        • 业务连续性要求
          • 提高效率是改进文件管理的驱动力。文件管理方面的技术进步,有助于组织简化流程、管理工作流、消除重复性的手动任务并实现协作。
      • 语境图
        • 图9-1 语境关系图:文件和内容管理
      • 目标和原则
        • 目标
          • 1)确保能够高速有效地采集和使用非结构化的数据和信息。2)确保结构化和非结构化数据之间的整合能力。3)遵守法律义务并达到客户预期。
        • 原则
          • 1)组织中的每个人都应该在保护组织的未来方面发挥作用。每个人都必须按照既定的制度和程序来创建、使用、检索和处置档案。
          • 2)档案和内容处理方面的专家应充分参与制度和规划的制定。不同的行业和法律管辖区之间,监管实践可能会有很大的差异。
      • 档案保存指导原则
        • ARMA国际(非营利性的档案和信息管理专业协会)在2009年发布
        • 内容
          • 问责原则
          • 完整原则
          • 保护原则
          • 遵从原则
          • 可用原则
          • 保留原则
          • 处置原则
          • 透明原则
      • 基本概念
        • 内容
          • 内容管理
            • 内容管理(Content Management)包括用于组织、分类和构造信息资源的流程、方法和技术,以便以多种方式存储、发布和重复使用这些资源。
          • 内容元数据
            • 非结构化数据内容的元数据基于:
              • 格式
              • 可搜索性
              • 自我描述性
              • 既有模式
                • 是否可以采用或者适配现有的方法和模式(如在图书馆目录中)。
              • 内容主题
                • 人们可能在寻找的东西。
              • 需求
                • 需要进行彻底和详细的检索能力(如制药或核工业)。
          • 内容建模
            • 内容建模(Content Modeling)是将逻辑内容概念转换为具有关系的内容类型、属性和数据类型的过程
          • 内容分发方法
            • 内容需要模块化、结构化、可重复使用,且与设备和平台无关
            • 内容分发系统可分为三种,分别是推式、拉式和交互式。
        • 受控词表
          • 受控词表(Controlled Vocabularies)是被明确允许用于通过浏览和 搜索对内容进行索引、分类、标引、排序和检索术语的定义列表
          • 词汇表管理
            • 词汇表管理关键问题集中于用途、消费者、标准、维护 4 个方面。
          • 词汇表视图和微控制词汇表
            • 词汇表视图(Vocabulary View)是受控词表的子集,涵盖了受控词表领域内有限范围的主题。
          • 术语和选择列表
          • 术语管理
            • 关系的类型
              • 等价术语关系
              • 层次化关系
                • 它描述广义(一般)到狭义(特定)或整体-部分的关系。
              • 关联关系
                • 与受控词表中的另一个术语相关联,但这种关联不是层次化的。
          • 同义词环和规范表
            • 同义词环(Synonym Ring)是指一组含义大致相同的术语。
            • 规范表(Authority List)是描述性术语的受控词汇表,旨在促进特 定领域或范围内的信息检索
          • 分类法
            • 不同结构
              • 扁平分类法
                • 在受控类别集之间没有关系,所有类别都是平等的。这类似于列表。例如,一个包含多个国家的列表。
              • 层次分类法
                • 它是一种树结构,其中节点通过规则相互关联。
              • 多重层级结构
                • 它是具有多个节点关系规则的树状结构。
              • 面分类法
                • 它指的是每个节点与中心节点相关联,其形状看起来像星形图。
              • 网状分类法
                • 既可用于层级结构,也可用于刻面结构
          • 分类方案和打标签
          • 主题词表
            • 主题词表(Thesauri)又称叙词表,是一种用于内容检索的受控词 表。它结合了同义词列表和分类方案的特征。主题词表提供相关的每个 术语及其与其他术语的关系信息
          • 本体
            • 本体(Ontology)是一种分类法,它代表一套概念和它们在某个领 域内概念之间的关联
        • 文件和档案
          • 概要
            • 文件
              • 文件(Document)是包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等的电子或纸质对象。文
            • 档案
              • 档案可用于证明所做的决策和所采取的行动是符合程序的;可作为组织业务活动和法规遵从的证据。
          • 文件管理
            • 管理文件和档案的生 命周期包括
              • 编目
                • 识别已有的和新建的文件/档案。
              • 制度
                • 文件/档案制度的创建、批准和实施,包括文件/档案的保管制度。
              • 分类
                • 文件/档案的分类
              • 存储
                • 纸质和电子文件/档案的短期和长期存储。
              • 检索和流转
                • 在遵守制度、安全、控制标准和法律的情况下,允许文件/档案的访问和流通。
              • 保存和处置
                • 在遵守组织需求、规章和法规的情况下,对文件/档案进行归档和销毁。
          • 档案管理
            • 档案管理包括整个档案的生命周期:从档案的创 建或接收到处理、分发、组织和检索,再到处置
            • 精心管理的档案具备以下特点
              • 内容
                • 内容必须准确、完整和真实。
              • 背景
                • 关于档案的创建者、创建日期或与其他档案关系的描述性信息(元数据)应该在创建档案时收集、组织并维护。
              • 及时性
                • 档案应该在事件、行为或决定发生后立即创建。
              • 永久性
                • 一旦成为档案,则在档案的法定保存期内不能改变其内容。
              • 结构
                • 档案内容的外观和排版需要清晰,它们应被记录在正确的表格或模板上。
          • 数字资产管理
        • 数据地图
          • 数据地图(Data Map)是所有ESI数据源、应用程序和IT环境的清单,其中包括应用程序所有者、保管人、相关地理位置和数据类型等信息。
        • 电子取证
          • “取证”(Discovery)是一个法律术语,指诉讼的预审阶段,双方当事人互相要求对方提供信息,以查明案件事实,并了解双方的论点有多强。
        • 信息架构
          • 信息架构是为信息体或内容创建的结构
          • 包括以下组件
            • 1)受控词表。2)分类法和本体。3)元数据映射。4)搜索功能规格。5)用例。6)用户流。
        • 搜索引擎
        • 语义模型
          • 语义建模(Semantic Modeling)是一种知识建模,描述一系列概念网络(有关的想法或主题)以及它们之间的关系。
        • 语义搜索
          • 语义搜索(Semantic Search)侧重于语义和语境而非预先设定的关键字。
        • 非结构化数据
          • 存储、完整性、安全性、内容质量、访问和有效使用对非结构化数据的管理都具有指导作用。
        • 工作流
    • 9.2 活动
      • 规划生命周期的管理
        • 概要
          • 文件管理实践涉及文件生命周期的规划——从文件的创建或接收文 件后的分发、存储、检索、归档和潜在的销毁。规划包括开发分类/索 引系统和分类法,以实现文件的存储和检索。重要的是,生命周期规划 中需要为档案建立具体的制度。
        • 规划档案管理
        • 制定内容策略
          • 内容管理计划应直接支持组织以有效和全面的方式提供相关和有用的内容。
      • 创建内容处理制度
        • 制定的制度中需要描述行为的原则、方向和指南等信息,以帮助员工理解并遵守文件和档案管理的要求。
        • 其他制度
          • 社交媒体制度
          • 设备访问制度
          • 处理敏感数据
          • 应对诉讼
            • 组织应通过有前瞻性的电子取证措施,为时刻可能的诉讼请求做好准备(报最好的希望,做最坏的打算)。
      • 定义内容信息架构
        • 数据管理专业人员在处理非结构化数据和内容的参考数据及元数据 时,可能会涉及受控词汇表和术语
      • 实施的声明周期管理
        • 获取档案和内容
        • 管理版本的控制
          • ANSI 859标准基于数据的重要性以及数据损坏或不可用时可能造成的损害,将数据控制分为3个等级:正式、修订和托管。
        • 备份和恢复
          • 文件/档案管理系统需要包含在组织的整体企业备份和恢复活动 中,包括业务连续性和灾难恢复计划
        • 管理保管和处置
        • 审计文件/档案
      • 发布和分发内容
        • 开放访问、搜索和检索
        • 通过可接受的渠道分发
    • 9.3 工具
      • 企业内容管理系统
        • 文件管理
          • 文件管理系统是用于跟踪和存储电子文件和纸质文件的电子影像的 应用程序
          • 一些文件管理系统拥有工作流模块,可以支持不同的工作流,如:1)手动工作流,指示用户将文件发往何处。2)基于规则的工作流,通过制定规则指示文件在组织内的流向。3)动态规则,允许基于内容的不同工作流。
        • 内容管理系统
          • 内容管理系统(Content Management System,CMS)用于收集、组织、索引和检索内容,将内容存储为组件或整个文件,同时保持组件之间的链接。
        • 内容和文件工作流
      • 协作工具
        • 协作工具(Collaboration Tools)可用于收集、存储、工作流程和管理与团队活动相关的文件。
      • 受控词汇表和元数据工具
      • 标准标记和交换格式
        • 可扩展标示语言( XML)
        • 基于JavaScript语言的轻量级的数据交换格式( JSON)
        • 资源描述框架(RDF)和相关的万维网联盟(W3C)规范
          • RDF以主语(资源)-谓语(属性名称)-宾语(属性值)表达式或 三元组的形式来描述资源
      • 电子取证技术
    • 9.4 方法
      • 诉讼应诉手册
      • 诉讼应诉数据映射
    • 9.5 实施指南
      • 就绪评估/风险评估
        • 概要
          • ECM关键成功因素包括对现有内容的审核和分类、合适的信息体系结构、内容生命周期的支持、适当元数据标签的定义以及在ECM解决方案中自定义功能的能力。
        • 档案管理成熟度
          • ARMA有一个信息治理成熟度模型,它可 以帮助组织评估档案保存计划和实践
          • 信息治理成熟度模型分为5个等级
            • 1级,低于标准的
              • 信息治理和档案保管问题没有得到解决或只是最低限度的解决。
            • 2级,发展中的
              • 认识到信息治理和档案保管可能对组织产生的影响。
            • 3级,基本的
              • 必须满足法律法规的最低要求。
            • 4级,积极的
              • 已经建立了一个以持续改进为重点的主动式信息治理计划。
            • 5级,完成变革的
              • 信息治理已经融入企业的基础架构和业务流程中。
          • 档案管理系统和应用程序的技术评估
            • 1)电子档案管理软件应用系统设计标准(DoD 5015.2)。2)电子办公环境中档案管理原则与功能要求(ISO 16175)。3)电子档案管理通用需求(MoReq2)。4)对象管理组(OMG)的档案管理服务(RMS)规范。
        • 电子取证评估
          • 成熟的规划将明确规定角色和职责、保存协议、数据收集方法和披露流程。
      • 组织和文化变革
        • 隐私、数据保护、机密性、知识产权、加密、道德使用和身份,这应是文件和内容管理专业人员与其他员工以及管理层和监管机构合作一起处理的重要问题。
    • 9.6 文件和内容治理
      • 信息治理架构
        • 驱动因素
          • 1)法律和法规遵从。2)档案的合理处置。3)对电子取证的前瞻性准备。4)敏感信息的安全。5)电子邮件和大数据等风险领域的管理。
        • 信息治理参考模型
          • 图9-4 信息治理参考模型
          • 外环包括了实施信息管理过程中涉及的制度、标准、流程、工具和基础架构等方面,中心展示了一张生命周期图。IGRM是对ARMA的GARP®的补充。
      • 信息的激增
      • 管理高质量的内容
        • 定义高质量的内容需要了解它生产和使用的背景,
          • 1)生产者。谁创建内容?为什么要创建?2)消费者。谁使用信息?出于什么目的?3)时间。何时需要信息?需要多久更新或访问一次?4)格式。消费者是否需要特定格式的内容才能实现目标?是否有不可接受的格式?5)分发。信息将如何分发?消费者将如何获取信息?如何实施安全措施以防止对电子内容的不恰当访问?
      • 度量指标
        • 概要
          • 关键业绩指标(KPI)是衡量组织绩效与目标的定量和定性指标。可以在战略和运营层面制定关键绩效指标。
        • 档案管理
          • 在战略层面,可以在档案管理法规遵从(如满足要求所花费的时间)和/或治理(如遵守制度)方面制定KPI。在运营层面,可以在档案管理资源(如运营和资本成本)、培训(如给定的类别数量、受过培训的员工数量及水平)、日常档案管理服务的提供与操作(如满足用户服务水平协议(SLA)的百分比)和/或档案管理功能与其他业务系统的整合(如集成的百分比)等方面制定KPI。
        • 电子取证
          • 电子取证常见的一个KPI指标是成本降低,另一个KPI指标是对比被动收集信息的方式,提前收集信息时提高的效率(如转为电子取证平均需要几天时间)。
        • 企业内容管理
          • 应制定KPI来衡量企业内容管理(ECM)的有形和无形效益。有形效益包括提高生产力、降低成本、提高信息质量和改善合规性;无形效益包括增进协作、简化工作程序和工作流。
  • 考察分值&知识点
    • 考察分值
      • 2分
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值