DAMA学习笔记(八)-文件和内容管理

1.引言

  文件和内容管理是指针对存储在关系型数据库之外的数据和信息的采集、存储、访问和使用过程的管理。 它的重点在于保持文件和其他非结构化或半结构化信息的完整性,并使这些信息能够被访问。在许多组织中,非结构化数据和结构化数据有着直接的关系,有关内容的管理决策应同样适用于非结构化数据的管理要求。 确保文件和内容管理的安全性和高质量,需要可靠的架构和管理良好的元数据。

1.1 业务驱动因素

  文件和内容管理的主要业务驱动因素包括法规遵从性要求诉讼响应能力电子取证请求能力以及业务连续性要求。

  • 法律法规要求组织保留某些活动的档案。档案包括纸质文件和电子存储信息(ESI)。
  • 诉讼的响应能力依赖于良好的档案管理机制, 同时良好的档案管理也是维持业务连续性的必要条件。
  • 电子取证是查找可能作为法律诉讼证据的电子档案的过程。组织应对电子取证请求的能力取决于其主动管理电子邮件、聊天、网站、电子文件等档案以及原始应用程序数据和元数据的水平。
    在这里插入图片描述
图9-1 语境关系图:文件和内容管理

1.2 目标和原则

1.2.1目标

  实施文件和内容管理最佳实践的目标,包括:

  • 1)确保能够高速有效地采集和使用非结构化的数据和信息
  • 2)确保结构化和非结构化数据之间的整合能力
  • 3)遵守法律义务并达到客户预期
1.2.2 原则

  文件和内容管理遵循以下指导原则:

  • 1)组织中的每个人都应该在保护组织的未来方面发挥作用。每个人都必须按照既定的制度和程序来创建、使用、检索和处置档案。
  • 2)档案和内容处理方面的专家应充分参与制度和规划的制定。不同的行业和法律管辖区之间,监管实践可能会有很大的差异。

  ARMA国际(非营利性的档案和信息管理专业协会)在2009年发布了一套被普遍接受的档案保存指导原则(GARP),它描述了应该如何维护业务档案。它还提供了具有相关指标的档案保存和信息治理框架。

  • 1)问责原则(Accountability)。组织应指派适当的高级管理人员,采用制度和流程来指导员工,并确保计划的可审计性。
  • 2)完整原则(Integrity)。建立信息治理规划,使组织创建或管理的档案和信息具有合理性以及适当的真实性和可靠性保证。
  • 3)保护原则(Protection)。建立信息治理规划,确保对个人信息或其他需要保护的信息提供合理的保护。
  • 4)遵从原则(Compliance)。建立信息治理规划,遵从适用的法律法规和其他有约束力的机构及组织的制度要求。
  • 5)可用原则(Availability)。组织应确保以及时、高效和准确检索其信息的原则来维护其信息。
  • 6)保留原则(Retention)。组织的信息应保留适当的时间,并考虑所有运营、法律、监管和财政以及其他所有相关约束的要求。
  • 7)处置原则(Disposition)。组织应根据其制度、适用的法律法规以及其他有约束力的机构要求,提供安全和适当的信息处置。
  • 8)透明原则(Transparency)。组织应以工作人员和利益相关方可以理解的方式记录其制度、流程和活动,包括其信息治理规划。

1.3 基本概念

1.内容

  内容是指文件、档案或网站内的数据和信息。内容通常基于文件所代表的概念以及文件的类型或状态来管理。内容也有生命周期,在其完整的生命周期中,有些内容成为组织的档案,但正式档案应与其他内容区别对待。

1) 内容管理

  内容管理(Content Management)包括用于组织、分类和构造信息资源的流程、方法和技术,以便以多种方式存储、发布和重复使用这些资源。

  内容的生命周期可以是动态的,通过受控的创建和修改流程进行日常更改;它们也可以是静态的,只发生很少或偶尔的更改。内容可以被正式的管理(严格存储、管理、审计、保留或处置)或通过临时更新的方式进行非正式的管理。

2) 内容元数据

  非结构化数据内容的元数据基于:

  • 1)格式。通常数据格式决定了访问数据的方法(如电子非结构化数据的电子索引)。
  • 2)可搜索性。是否已经具备用于搜索相关非结构化数据的工具。
  • 3)自我描述性。元数据是否有自我描述能力(如在文件系统中)。
  • 4)既有模式。是否可以采用或者适配现有的方法和模式(如在图书馆目录中)。
  • 5)内容主题。人们可能在寻找的东西。
  • 6)需求。需要进行彻底和详细的检索能力(如制药或核工业)。

通常,非结构化数据的元数据维护变成了对各种本地模式与企业正式元数据集之间交叉引用的维护。

3) 内容建模

  内容建模(Content Modeling)是将逻辑内容概念转换为具有关系的内容类型、属性和数据类型的过程。属性描述了关于该内容的一些特定的和可区分的信息。数据类型限制了属性可以包含的数据的类型,从而使验证和处理成为可能。元数据管理和数据建模技术用于开发内容模型。

  内容建模有两个层次。第一个是信息产品级别,它会产出一个像网站一样的实际可交付成果;第二个是组件级别,它进一步详细说明了构成信息产品模型的元素。模型中的详细程度取决于重用和构造所需的粒度。

4) 内容分发方法

  内容需要模块化、结构化、可重复使用,且与设备和平台无关。交付的方式包括网页、打印文稿和手机应用以及具有交互式视频和音频的电子书。内容分发系统可分为三种: 推式、拉式和交互式。

  • 1)推式(Push)。在推式系统中,用户按照预先确定的时间表选择传送给他们的内容类型。发布方创建内容并在多个地方将其发布。
  • 2)拉式(Pull)。在拉式系统中,用户通过互联网获取内容。
  • 3)交互式(Interactive)。在应用程序之间共享数据的选项,包括企业应用程序集成(EAI)、更改数据采集、数据集成和EII。
2.受控词表

  受控词表(Controlled Vocabularies)是被明确允许用于通过浏览和搜索对内容进行索引、分类、标引、排序和检索术语的定义列表。词汇表的复杂程度包括从简单的列表或选项列表,到同义词环圈或规范表、分类法以及最复杂的主题词表和本体。

1) 词汇表管理

  词汇表管理是针对任何给定的词汇进行定义、寻源、导入和维护的过程。实现词汇表管理的关键问题集中在用途消费者标准维护 4个方面。 1)这个词汇表支持哪些信息概念?2)谁是这个词汇表的受众?他们支持哪些流程?他们扮演什么角色?3)词汇表是必需的吗?它会支持哪个应用、内容管理或者分析?4)哪个决策机构负责指定首选术语?5)有哪些不同的现有词汇表来对此信息进行分类?它们在哪里?它们是如何创建的?谁是它们的主题专家?是否有任何安全或隐私问题? 6)是否有现成的标准可以满足这种需求?对比内部标准,采用外部标准有哪些担忧?标准的更新频率以及每次更新的更改程度如何?标准是否易于导入/维护,是否有性价比? 上述评估结果有利于数据整合, 提高数据质量。

2) 词汇表视图和微控制词汇表

  词汇表视图(Vocabulary View)是受控词表的子集,涵盖了受控词表领域内有限范围的主题。当目标是使用包含大量术语的标准词汇表时,词汇表视图是必要的,但并非所有术语都与顾客需要的信息有关。 词汇表视图通过只展示适合用户的内容来增加信息的可用性。对每个词汇表视图都是通过定义一组规则来确定包含哪些术语。

  微控制词汇表(Micro-Controlled Vocabulary)是包含一般词汇表中不包含的高度专业化术语的词汇表。这些术语应该映射到广泛受控词汇的层次结构上。微控制词汇表在对应的术语关系上存在着内在一致性。

3) 术语和选择列表

  术语列表仅仅就是一个列表(List)。它们不会描述术语之间的关系。信息系统中的选项列表、网页下拉列表和菜单选项列表都在使用术语列表。

  选择列表(Pick Lists)通常隐藏在应用程序中。内容管理软件可以帮助将选择列表和控制词汇转换为可用于主页搜索的选择列表。

4) 术语管理

  术语管理包括在受控词汇表中建立术语之间的关系。关系的类型可以分为以下3种:

  • 1)等价术语关系(Equivalent Term Relationship)。这种关系同时使用多个术语而不是进行交叉引用术语。这是IT中最常用的术语映射功能,表示来自一个系统或词汇表的术语或值与另一个系统或词汇表相同,因此集成技术可以执行它们的映射关系并标准化。
  • 2)层次化关系(Hierarchical Relationship)。它描述广义(一般) 到狭义(特定)或整体-部分的关系。
  • 3)关联关系(Related Term Relationship)。与受控词表中的另一个术语相关联,但这种关联不是层次化的。
5) 同义词环和规范表

  同义词环(Synonym Ring)是指一组含义大致相同的术语。同义词环允许搜索其中一个术语的用户去访问与该词环其他术语相关的内容。 开发同义词环手册的目的是用于检索而非索引。提供同义词控制,并同等地对待同义词和近似同义词,在索引环境具有非受控词汇表或没有索引的情况下使用。

  规范表(Authority List)是描述性术语的受控词汇表,旨在促进特定领域或范围内的信息检索。其术语处理方法和同义词环不同;在同义词环中有一个术语是首选,其他术语则是变体。权限文件交叉引用每个术语的同义词和变体,以指引用户从非优选术语到优选术语。该列表可能包含也可能不包含这些术语的定义。权限列表应该有指定的管理者,他们可能有结构,一个很好的例子就是美国国会图书馆的主题标题。

6) 分类法

  分类法(Taxonomies)是指任何分类或受控词表的总称。最著名的例子是瑞典生物学家林奈(Linnaeus)开发的所有生物的分类系统。 在内容管理中,分类法是一种命名结构,包含用于概述主题、启用 导航和搜索系统的受控词表。分类法有助于减少歧义并控制同义词。层次分类法包含了对索引者和搜索者都有帮助的多种类型的父/子关系。分类法可以有多种不同的结构:

  • 1)扁平分类法(Flat Taxonomy)。在受控类别集之间没有关系,所有类别都是平等的。例如,一个包含多个国家的列表。
  • 2)层次分类法(Hierarchical Taxonomy)。它是一种树结构,其中节点通过规则相互关联。层次结构至少具有两个级别并且是双向的。向 上移动层级会扩展类别;向下移动会细化类别。eg:地理信息,从所属大陆直到详细的街道地址。
  • 3)多重层级结构(Polyhierarchy)。它是具有多个节点关系规则的树状结构。子节点可能有多个父节点,父节点也可以共用一个祖父节点。因此,遍历路径可能会很复杂,所以必须注意避免潜在的无效遍历:从与父节点相关的节点开始向上遍历而非祖父节点。然而,复杂的多重层级结构可能更适合面分类法。
  • 4)面分类法(Facet Taxonomy)。它指的是每个节点与中心节点 相关联,其形状看起来像星形图。每个面是中心对象的一个属性。元数据中每个属性(创建者、标题、访问权限、关键字、 版本等)是内容对象的一个面。
  • 5)网状分类法(Network Taxonomy)。既可用于层级结构,也可 用于刻面结构。网状分类中的任何两个节点都基于它们的关联来建立链接,其中一个例子就是推荐引擎(如果你喜欢那个,你可能也会喜欢这个);另一个例子是主题词表。

如果不对分类法进行维护,则会产生理解不充分或者错误的结果,并造成被监管的实体和工作人员不合规的风险。根据不同的需求以及组织根据不同业务场景的整体思考, 可以自定义分类法, 实现各种不同的业务需求。

7) 分类方案和打标签

  分类方案(Classification Schemes)是代表受控词表的代码。这些方案通常是分层的,可能有与之相关的词汇。大众分类法是通过社交标签对在线内容术语和名称分类的方案。个人用户和团体使用它们来注释和分类数字内容。它们通常没有层次结构或优选术语。因为专家不收集整理它们。大众分类法通常被认为不具有权威性,通常也不应用于文件索引。大众分类法直接来自用户的词汇表,所以它们提供了增强信息检索的潜力。

8) 主题词表
  • 主题词表(Thesauri)又称叙词表,是一种用于内容检索的受控词表。
  • 主题词表提供相关的每个术语及其与其他术语的关系信息。关系要么是层次关系(父/子或广义/狭义),要么是关联关系或等价关系。
  • 主题词表可用于梳理非结构化的内容,揭示来自不同介质的内容之间的关系,改进网站导航并优化搜索。
9) 本体
  • 本体(Ontology)是一种分类法,它代表一套概念和它们在某个领域内概念之间的关联。
  • 本体描述类(概念)、个体(实例)、属性、关系和事件。
  • 本体论可以是一系列的分类法和常见同义词表,用于知识表示和信息交换。
  • 本体论通常由包含关系的多个类和定义组成层次结构。
  • 分类法(如数据模型)和本体之间存在两个主要区别:
    • 1)分类法为给定的概念区域提供数据内容分类。在本体中,实体、属性和内容概念可以完全混合。差异是通过元数据或其他关系来识别的。
    • 2)在分类法或数据模型中,定义是已知的,别无其他,称为封闭世界假设。在本体中,基于现存的关系可以推断出可能的关系。未明确声明的内容也可能是真的,称之为开放世界假设。
3.文件和档案

  文件(Document)是包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等的电子或纸质对象。 文件可用于交流并分享信息和知识。程序、协议、方法和说明书都属于文件。只有部分文件才能称为档案(Record)。档案可用于证明所做的决策和所采取的行动是符合程序的;可作为组织业务活动和法规遵从的证据。档案通常是由人来创建的,但仪器和监控设备也可以提供数据来自动生成档案。

1) 文件管理

  文件管理包括在文件和档案的整个生命周期中控制和组织它们的流程、方法和技术。它包括电子和纸质文件的存储、编目和控制。目前,90%以上的文件都是电子文件。一般来说,文件管理关注的是文件本身,几乎不关注文件内容。一个文件中的信息内容可能对如何管理该文件有指导性作用,但是在文件管理中,文件被视为一个单独的实体。管理文件和档案的生命周期包括:

  • 1)编目。识别已有的和新建的文件/档案。
  • 2)制度。文件/档案制度的创建、批准和实施,包括文件/档案的保管制度。
  • 3)分类。文件/档案的分类。
  • 4)存储。纸质和电子文件/档案的短期和长期存储。
  • 5)检索和流转。在遵守制度、安全、控制标准和法律的情况下,允许文件/档案的访问和流通。
  • 6)保存和处置。在遵守组织需求、规章和法规的情况下,对文件/档案进行归档和销毁。

在这里插入图片描述

图9-2 基于ISO 9001-4.2的文件层次结构

  基于ISO 9000的简介和支持包、ISO 9001-4.2文件要求指南,描述了一种适用于政府或军方以文件为中心的模式。ISO 9001描述了基本质量管理体系的最小组成部分。商业实体可能具有不同的文件层次结构或流程来支持业务实践。

2) 档案管理

  档案管理(Records Management)是文件管理的一部分,管理档案有一些特殊的要求。档案管理包括整个档案的生命周期:从档案的创建或接收到处理、分发、组织和检索,再到处置。档案可以是物理的(如文件、备忘录、合同、报告或缩微胶片)、电子的(如电子邮件内容、附件和即时消息),也可以是网站上的内容及各种介质和硬件上的文件,还可以是各种数据库中采集的数据,甚至是混合档案,如光圈卡(带有嵌入细节或支持材料的缩微胶片窗口的纸质记录)是把各种格式组合在一起。档案管理要求组织知道哪个副本(电子或纸质)是正式的“档案副本”,以履行档案保存义务。 精心管理的档案具有以下特点:

  • 1)内容。内容必须准确、完整和真实。
  • 2)背景。关于档案的创建者、创建日期或与其他档案关系的描述性信息(元数据)应该在创建档案时收集、组织并维护。
  • 3)及时性。档案应该在事件、行为或决定发生后立即创建。
  • 4)永久性。一旦成为档案,则在档案的法定保存期内不能改变其内容。
  • 5)结构。档案内容的外观和排版需要清晰,它们应被记录在正确的表格或模板上。
3) 数字资产管理

  数字资产管理(Digital Asset Management,DAM)和文件管理流程相似,它专注于存储、跟踪和使用视频、徽标、照片等富媒体文件。

4.数据地图

  数据地图(Data Map)是所有ESI数据源、应用程序和IT环境的清单,其中包括应用程序所有者、保管人、相关地理位置和数据类型等信息。

5.电子取证

  电子文件通常具有元数据(可能不适用于纸质文件),它们在证据中起着重要作用。法律的要求来自关键的法律程序,如电子取证、数据和档案保留实践、法律保留通知(LHN)流程以及法律上可靠的处置做法。图9-3描绘了由EDRM开发的高级电子取证参考模型,EDRM是电子取证标准和指南的组织。该框架提供了一种电子取证的方法,对于涉及确定相关内部数据的存储方式和位置、适用什么保留策略、哪些数据不可访问以及哪些工具可用于协助识别流程的人员来说。
在这里插入图片描述

图9-3 电子取证参考模型
  • 在辨认阶段,它有两个子阶段。早期案例评估和早期数据评估(未在图中描述)。
    • 在早期案例评估中,主要评估的是法律案例本身的相关信息,称之为描述性信息或元数据(如关键字、日期范围等)。
    • 在早期数据评估中,与案例相关的数据类型和位置会被评估。数据评估应确定与保留或销毁相关的数据制度,以便保留ESI。
  • 在保全和收集阶段,保全可以确保那些已经被认为是可能相关的数据被置于合法保留状态,以避免被销毁;收集包括以合法的方式从公司获取和转移已辨认的数据并提供给法律顾问。
  • 在处理阶段,经过去重、搜索和分析数据,来确定哪些数据项将会进入到审查阶段。
  • 在审查阶段,确定提交文件以响应请求,还确定了将被扣留的特权文件。
  • 处理和审查依赖于分析阶段的结果,但分析被认为是一个单独的阶段,侧重于内容。
  • 在生成阶段,根据商定的规范将数据和信息交给对方律师。
  • ESI展品可以用纸质、近纸质、近本地和本地的格式展示,以支持或反驳案例中的要素。
6.信息架构

  信息架构是为信息体或内容创建的结构。它包括以下组件:1)受控词表2)分类法和本体3)元数据映射4)搜索功能规格5)用例6)用户流。信息架构和内容制度共同描述了“什么”,即哪些内容将在系统中被管理。设计阶段描述了“如何”实施内容管理制度。信息架构是开发一个富有成效网站的核心。故事板为Web项目提供了蓝图。作为设计大纲,定义了每个web页面上所需的元素,并 显示了页面如何协同工作的导航和信息流,以指导开发导航模型、菜单和管理及使用网站所需的其他组件。

7.搜索引擎

  搜索引擎(Search Engine)是一种根据术语搜索信息并检索内容中包含这些术语网站的软件,如Google。搜索功能需要几个组件:适当的搜索引擎软件、漫游网络的爬虫、将找到内容的统一资源定位符(URL)保留起来的存储、索引遇到的关键字和文本以及排名规则等。

8.语义模型

  语义建模(Semantic Modeling)是一种知识建模,描述一系列概念网络(有关的想法或主题)以及它们之间的关系。语义模型包含语义对象语义约束语义对象是模型中表示的事物,它们可以具有基数和域的属性以及标识符。语义约束表示UML中的关联或关联类模型,这些模型有助于识别模式和趋势,并发现可能看起来不相干信息之间的关系。

9.语义搜索

  语义搜索(Semantic Search)侧重于语义和语境而非预先设定的关键字。语义搜索引擎可以使用人工智能基于单词及其语境来识别查询匹配。语义搜索的要求包括弄清楚用户想要什么,也就是需要像用户一样思考。语义优化的网络内容包含自然关键词,而不是依赖于严格的关键字插入。语义关键字的类型包括:包含变体的核心关键字、概念相关术语的主题关键字和能够预测用户可能会问什么的词干关键字。商务智能(BI)和分析工具的用户通常具有语义搜索的需求。

10.非结构化数据

  非结构化数据有多种电子格式:文字处理文件、电子邮件、社交媒体、聊天室、平面文件、电子表格、XML文件、事务性消息、报告、 图形、数字图像、缩微胶片、视频和音频。纸质文件中也存在大量非结构化数据。数据管理的基本原则既适用于结构化数据也适用于非结构化数据。

11.工作流

  工作流组件可以包括创建、处理、路由、规则、管理、安全性、电子签名、截止日期、升级(如果出现问题)、报 告和交付等过程。它应该通过使用内容管理系统(CMS)或其他独立系统来实现自动化,而不是人工处理。 将内容嵌入CMS时,将为其加上时间戳,分配版本号,并将更新人员的姓名标记在上面。

2.活动

2.1 规划生命周期的管理

  文件管理实践涉及文件生命周期的规划——从文件的创建或接收文件后的分发、存储、检索、归档和潜在的销毁。规划包括开发分类/索引系统和分类法,以实现文件的存储和检索。重要的是,生命周期规划中需要为档案建立具体的制度。1) 确定负责管理文件和档案的组织部门。 2) 要制定一份整体的文件管理计划,其中包括重要文件和档案的业务连续性计划。

1.规划档案管理
  • 在档案管理时先要清楚什么是档案。定义某一专业领域的档案应该包括来自该领域的专家以及理解档案管理体系的人员。
  • 在管理电子档案时需要决定现行的常用档案存储在哪里以及如何存储老旧的档案
  • 档案管理方法应将纸质档案、非结构化数据以及结构化电子档案全都考虑在内。
2.制定内容策略
  • 内容管理计划应直接支持组织以有效和全面的方式提供相关和有用的内容。计划中应考虑内容的驱动因素(需要内容的原因)、内容创建和交付等。
  • 对内容策略应从对当前状态的审视和差距评估开始。该策略定义了如何对内容进行优先级排序、组织和访问。通过评估会揭示内容创建的生产、工作流程和审批流程的简化方法。

2.2 创建内容处理制度

  制定的制度中需要描述行为的原则、方向和指南等信息,以帮助员工理解并遵守文件和档案管理的要求。大多数文件管理制度都包括以下相关的内容:1)审计的范围和合规性。 2)重要档案的鉴定和保护 3)保留档案的目的和保管期限表。 4)如何响应信息保留命令(特殊保护令),即针对已过保留期的诉讼信息要求。 5)本地和异地存储档案的要求。 6)硬盘驱动器和共享网络驱动器的使用和维护。 7)对电子邮件管理,从内容管理的角度进行处理。 8)合理的档案销毁方法,如预先批准的供应商和销毁证明的收据。

2.3 定义内容信息架构

  用户必须以系统检索机制能够理解的形式提交他们的需求,以便从这些系统中获取信息。同样, 需要一种检索机制,以支持快速识别匹配的数据和信息格式描述/索引文件、结构化和非结构化数据的目录。基于用户的需求和偏好,索引的设计侧重于索引的关键或属性的决策选项。数据管理专业人员应该确保构建受控词汇表、索引、信息检索分类方案工作的互相协调, 满足用户的需求。

2.4 实施的生命周期管理

1.获取档案和内容
  • 电子内容通常已经以某种格式存储在电子存储库中。
  • 为了降低丢失或损坏档案的风险,需要扫描纸质内容,然后上传到系统中,编入索引并存储在存储库中,尽可能使用电子签名。
  • 获取内容之后,使用适当的元数据对其进行标记索引,如至少包括文件或图像标识符、采集的数据和时间、标题和作者, 元数据对于检索内容以及理解内容的背景是必需的。
  • 将社交媒体内容保存在存储库中,以使其能够被审阅、元标记、分类以及作为档案进行管理。
2.管理版本控制

  ANSI 859标准基于数据的重要性以及数据损坏或不可用时可能造成的损害,将数据控制分为3个等级:正式、修订和托管。

  • 1)正式控制(Formal Control)。需要正式的变更启动、对影响的全面评估、变更管理机构的决策以及给利益相关方一份全面执行和验证的状态报告。
  • 2)修订控制(Revision Control)。没那么正式,在需要变更时通知利益相关方并升级版本。
  • 3)托管控制(Custody Control)。最不正式,仅需要安全存储和一 套检索方法。

  ANSI 859标准建议在决定数据资产的控制级别时,应将下面的标准考虑在内:

  • 1)提供和更新资产的成本。
  • 2)项目影响(如果变更将产生重大成本或进度后果)。
  • 3)企业或项目变更的其他后果。
  • 4)需要重新使用资产或资产的早期版本。
  • 5)维护变更历史(当企业或项目要求时)。
3.备份和恢复
  • 文件/档案管理系统需要包含在组织的整体企业备份和恢复活动中,包括业务连续性和灾难恢复计划。
  • 重要档案规划使组织能够访问在灾难期间开展业务和随后恢复正常业务所需的档案。
  • 必须确定哪些是重要档案,并制定和维护其保护和恢复计划。
  • 档案经理应参与风险缓解和业务连续性规划,以确保这些活动能够保证重要档案的安全。
  • 灾难可能包括停电、人为错误、网络和硬件故障、软件故障、恶意 攻击以及自然灾害。
  • 业务连续性计划(或灾难恢复计划)包含书面制度、程序和信息,旨在缓解对组织数据(包括文件)威胁的影响。
4.管理保管和处置
  • 保管和处置制度规定用于运营、法律、财政或历史价值的文件时间范围,规定何时可以将不常用的文件转移到二级存储设施,如异地存储。
  • 保管和处置制度明确了合规性流程以及处理文件的方法和期限表。在制定保管期限表时,必须要考虑法律和监管要求。
  • 档案管理人员或信息资产所有者要实施监督工作,以确保团队对隐私和数据保护要求负责,并采取相应的措施防止身份盗用。
  • 访问电子档案可能需要特定版本的软件和操作系统。
  • 无附加值的信息应该从组织的资产中移除并处理掉,以避免浪费实体和电子空间以及与其维护相关的成本。许多组织并没有优先删除无附加值的信息,这是因为:1)制度不适用。2)对某一个人来说是无附加值信息,但对另一个人来说却是有价值的信息。3)无法预见当前的无附加值实体和/或电子档案未来可能的需求。4)对档案管理的不认可。 5)无法决定删除哪些档案。6)做决定与移除实体和电子档案的感知成本。 7)电子空间很便宜,购买更多的空间比归档和移除过程更容易。
5.审计文件和档案

  要求定期审计文件和档案管理,以确保正确的信息在正确的时间送达正确的人员,以便做出决策或进行操作活动。表9-2包含了审计评估的示例。

表9-2 审计评估样例
文件/档案管理组件审计评估样例
库存清单库存清单中的每一个位置都是可以唯一标识的
存储存储区域有足够的空间容纳不断增加的文件/档案
可靠性和准确性实施抽查以确认文件/档案充分反映了所创建或接收的内容
分类和索引方案详细描述元数据和文件计划
访问和检索最终用户可以轻松查找和检索关键信息
保管过程保管期限表结构要有逻辑、要么按部门、功能划分,要么案主要的组织职能划分
处置方法按照建议方法处置文件/档案
保密和安全违反文件/档案的保密性和造成文件/档案丢失都要被当作是安全事件,应妥善处理
组织对文件/档案管理的理解就文件/档案管理相关的角色和职责,向利益相关方和员工提供适当的培训

审计通常包括以下步骤:

  • 1)定义组织驱动因素,并确定“为什么”要进行文件/记录管理的利益相关方(Why)。
  • 2)一旦确定了检查/测量的内容和要使用的工具(如标准、基准、访问调查),就开始收集相关数据(How)。
  • 3)报告结果。
  • 4)制订下一步的行动计划和时间表。

2.5 发布和分发内容

1.开放访问、搜索和检索

  通过元数据/关键字标记对内容进行了描述,并在适当的信息内容体系结构中进行了分类,就可以对其进行检索和使用。搜索引擎可以根据关键字返回内容。

2.通过可接受的渠道分发

  由于内容消费者更想在自己选择的设备上消费或使用内容,因而分发期望有所改变。如果用户希望有另一种分发渠道,则必须为这个渠道量身定做(如打印)该内容。所以存在一种可能性,即任何改变的内 容都可能需要变回原来的格式。 来自数据库的结构化数据被格式化为HTML后,再将HTML格式恢复到原始的结构化数据就很难了,因为将数据从格式中分离出来并不总是那么简单易行。

3.工具

3.1 企业内容管理系统

  企业内容管理系统由一套包含核心组件的平台或一组应用程序组成,应用可以全部整合在一起,也可以分开使用。组件可以部署在公司内部, 也可以部署在云端。

1.文件管理

  文件管理系统是用于跟踪和存储电子文件和纸质文件的电子影像的应用程序。文件库系统、电子邮件系统和影像管理系统是专门的文件管理系统。文件管理系统通常具有存储、版本控制、安全性、元数据管理、内容索引和检索功能。某些系统的扩展功能可以包括文件的元数据视图。

  在文件管理系统中创建或通过扫描仪及OCR软件采集文件。在采集过程中通过关键字或文本对这些电子文件进行索引,以便容易被找到。通常每个文件都会保持一些元数据,如创建者的名称以及文件 创建、修改、存储的日期。使用唯一文件标识符或指定涉及文件标识符和/或预期元数据的部分搜索条件,来对文件进行分类,以实现对文件的检索。元数据可以自动从文件中提取或由用户添加。

  文件存储库具有管理文件的功能,包括签入签出、版本控制、协作、比较、归档、状态、从一个存储介质迁移到另一个存储介质以及处置等特性。它可以提供对处于自身存储库以外的文件的一些访问和版本管理(如在文件共享或云环境中)。

  文件管理系统有权限管理模块,管理员可以根据文件类型和用户凭据来管理访问权限。组织可以决定某些特定类型的文件,需要哪些额外的安全保障或控制程序。安全限制包括隐私和保密限制,适用于文件创建和管理阶段,同时在分发阶段也同样适用。

2.内容管理系统

  内容管理系统(Content Management System,CMS)用于收集、组织、索引和检索内容,将内容存储为组件或整个文件,同时保持组件之间的链接。CMS还可以提供修改文档内容的控件。虽然文档管理系统可以对其控制下的文档提供内容管理功能,但是内容管理系统本质上独立于文档的存储位置和存储方式。

  CMS负责管理内容的整个生命周期,如网页内容管理系统通过编辑、协作和核心存储库中的管理工具控制网站内容。它可能包含界面友好的内容创建、工作流和变更管理以及用于处理内联网、互联网和外联网应用程序的部署功能。分发功能可能包括响应式设计和自适应能力, 以支持一系列的客户端设备。其他组件可能包括搜索、文件合成、电子签名、内容分析和移动应用程序。

3.内容和文件工作流

  工作流工具支持业务流程、路由内容和文件、指派工作任务、跟踪状态以及创建审计跟踪。在内容发布之前,工作流应支持对内容的审核和批准。

3.2 协作工具

  协作工具(Collaboration Tools)可用于收集、存储、工作流程和管理与团队活动相关的文件。社交网络可以使个人和团队在内部共享文件和内容,并通过博客、wikis、RSS和标签与外部团队进行交互。

3.3 受控词汇表和元数据工具

  开发或管理受控词汇表和元数据的工具,包括办公软件、元数据库和BI工具以及文件和内容管理系统。例如:

  • 1)在组织中被用作数据指南的数据模型。
  • 2)文件管理系统和办公软件。
  • 3)元数据库、术语表或目录。
  • 4)分类法和分类法之间的交叉参考模式。
  • 5)集合索引(如特定的产品、市场或安装)、文件系统、民意调查、档案、位置或异地控股。
  • 6)搜索引擎。
  • 7)非结构化数据的BI工具。
  • 8)企业和部门同义词表。
  • 9)已发布的报告库、内容和参考书目及其目录。

3.4 标准标记和交换格式

  计算机应用程序无法直接处理非结构化数据和内容。标准的标记和交换格式有助于在信息系统和互联网之间共享数据。

1.可扩展标示语言(XML)
  • 可扩展标记语言(XML)表示结构化和非结构化数据和信息的语言。
  • XML使用元数据来描述任何文件或数据库的内容、结构和业务规则。
  • XML需要将数据结构转换为用于数据交换的文件结构。
  • XML标记数据元素以识别数据的含义。简单的嵌套和引用提供了数据元素之间的关系。
2.JSON
  • JSON(Java Script Object Notation)是一种开放的、轻量级的数据交换标准格式。
  • JSON有两个结构:一是无序“‘名称/值’对”的集合,也被称为对象;二是值的有序集合,也被称为数组。
  • JSON是一种与XML相似但更紧凑的数据表示、传送和解释方法。
3.资源描述框架(RDF)和相关的万维网联盟(W3C)规范
  • RDF以主语(资源)-谓语(属性名称)-宾语(属性值)表达式或三元组的形式来描述资源。
  • 主语-谓语-宾语每个都由一个URI(统一资源标识符)描述,但主语和宾语可以是空节点,并且谓语可以是文字(不支持空值和空字符串)。
  • 最常见的URI格式是统一资源定位符 (URL)。
  • RDF使用XML作为其编码语法,它将元数据视为数据(如作者、创建日期等)。
  • 网络本体语言(W3C Web Ontology Language,OWL)是RDF的词汇表扩展。
  • W3C是一种语义标记语言,用于在网络上发布和共享OWL文件(本体),适用于那些需要由应用程序而不是由人类来处理文件中的信息情形。
4.Schema.org
  • Schema.org提供了一组用于页面标记的共享词汇表或模式,以便主流的搜索引擎可以理解它们。
  • Schema.org侧重于网页上的文字含义以及术语和关键词。
  • Schema.org词汇表集合还可用于结构化数据的互操作(如与JSON)。

3.5 电子取证技术

  电子取证通常涉及审查大量文件。电子取证技术活提供了许多功能和技术,如早期案例评估、收集、辨认、保全、处理、光学字符识别(OCR)、剔除、相似性分析和电子邮件线程分析。技术辅助审查(TAR)是一个工作流或过程。在此过程中,团队可以审查选定的文件并标记相关与否。这些决策成为预测编码引擎的输入,该引擎根据相关性对剩余的文件进行审查和排序。信息治理的支持可能也是电子取证的一个特征。

4.方法

4.1 诉讼应诉手册

  指引应明确电子取证的目标环境,并评估当前环境和目标环境之间是否存在差距;应记载电子取证活动生命周期的业务流程,明确电子取证团队的角色和职责;还可以使组织识别风险并主动预防可能导致诉讼的情况。

指引手册汇编内容主要包括:

  • 1)给每个部门(法律、档案管理、IT)建立制度和过程清单。
  • 2)为各主题起草制度,如诉讼保留、文件保管、归档和备份。
  • 3)评估IT工具的能力,如电子取证索引、搜索和收集、数据隔离和保护工具以及非结构化ESI源/系统。
  • 4)识别和分析相关的法律问题。
  • 5)制订沟通和培训计划,根据预期对员工进行培训。
  • 6)确定可以提前准备的材料,以便根据法律案例进行裁减。
  • 7)在需要外部服务的情况下分析供应商服务。
  • 8)制定如何处理通知的流程并保持指引手册的最新状态。

4.2 诉讼应诉数据映射

  电子取证通常有时间限制(如90天)。为律师提供可用的IT和ESI环境的数据映射,可以使组织更有效地做出应诉。数据映射是一个信息系统的目录,描述了系统以及系统的用途、包含的信息、保留策略和其他特征。从目录中通常会识别档案系统、源应用程序、存档、灾难恢复副本或备份以及用于每个系统的介质。数据映射应该是全面的,包含所有系统。由于电子邮件通常是诉讼中的详细审查对象,因此数据映射中还应描述电子邮件的存储、处理和使用方式。将业务流程映射到系统列表并记录用户角色和特权,能够实现对信息流的评估和记录。

  电子取证数据映射中应指明哪些档案易于访问、哪些档案不易访问。这两个类别有不同的电子取证规则。难以访问的数据需要被识别出来,并且记下它们难以访问的原因。为了对诉讼作出恰当的响应,组织应该拥有异地存储档案的清单,包括外部云存储。

5.实施指南

  实施企业内容管理(ECM)是一项代价高昂的长期工作,与任何企业范围的工作一样,需要利益相关方的广泛支持以及执行委员会的资金支持。

5.1 就绪评估/风险评估

  ECM就绪评估的目的是确定内容管理需要改进的方面,以及组织对改变其流程以满足这些需求的适应程度。数据管理成熟度评估模型可以在此过程中提供帮助。

  ECM成功的关键因素类似于IT项目管理(如执行支持、用户参与、用户培训、变更管理、企业文化和沟通)。具体的ECM关键成功因素包 括对现有内容的审核和分类、合适的信息体系结构、内容生命周期的支持、适当元数据标签的定义以及在ECM解决方案中自定义功能的能力。

1.档案管理成熟度

  ARMA的公认档案保管原则®可以用于指导组织评估其档案管理的制度和规范。与GARP一起,ARMA有一个信息治理成熟度模型,它可以帮助组织评估档案保存计划和实践。该成熟度模型根据GARP 8个原则中的每一个原则,在5个成熟度等级上对信息治理和档案保管环境的特征作出了描述。这5个等级分别是:

  • 1)1级,低于标准的(Sub-Standard)。信息治理和档案保管问题没有得到解决或只是最低限度的解决。
  • 2)2级,发展中的(In Development)。认识到信息治理和档案保管可能对组织产生的影响。
  • 3)3级,基本的(Essential)。必须满足法律法规的最低要求。
  • 4)4级,积极的(Proactive)。已经建立了一个以持续改进为重点的主动式信息治理计划。
  • 5)5级,完成变革的(Transformational)。信息治理已经融入企业的基础架构和业务流程中。

  应对档案管理评估准备中发现的差距和风险以及它们对组织的潜在影响进行分析。企业必须遵守维护和安全销毁档案的法律和要求。如果一个组织不清楚它的档案情况,则会处于危险之中,因为它无法知道它的档案是否已经被盗或被破坏。

2.电子取证评估

  评估准备中应检查并确定诉讼应诉计划的改进机会。成熟的规划将明确规定角色和职责、保存协议、数据收集方法和披露流程。规划和产生的流程都应被记录在案,要合乎情理并且具备可审计性。没有前瞻性的诉讼应诉是有风险的,这种风险应该被评估和量化。如果电子取证需要用到较旧的原不应被清除的档案,则没有数据和信息保管期限表可能会导致法律责任。

5.2 组织与文化变革

  组织经常用到的信息和档案是分部门管理,这就产生了数据孤岛,阻碍了数据的共享和正常管理。全面的企业内容和档案管理方法可以消除用户认为他们需要存储内容副本的看法。理想的解决方案是集中和安全管理的单一存储库,在整个企业中实施明确定义的策略和流程。一个集中化的组织,通常会处理改善信息访问的流程,控制占用办公空间的物料增长,降低运营成本,保护重要信息,使诉讼风险最小化,并支持更好的决策。

  内容和档案管理的地位都需要在组织内提升,不应该被视为是低级别或低优先级的功能。在受到严格监管的行业中,档案和信息管理(RIM)职能需要与公司的法律职能以及电子取证职能紧密结合。如果组织的目标是通过更好地管理信息来提高运营效率,那么RIM应该与营销或运营支持小组保持一致。如果组织将RIM视为IT的一部分,则RIM 职能应包括可以直接向首席信息官(CIO)或首席数据官(CDO)报告。通常,RIM职能可在ECM程序或企业信息管理(EIM)规划中找到。

6.文件和内容治理

6.1 信息治理架构

  文件、档案和其他非结构化内容可能会给组织带来风险。无论是从管理风险还是从这些信息中获取价值来考虑,都需要对信息进行治理。其驱动因素包括: 1)法律和法规遵从。 2)档案的合理处置。 3)对电子取证的前瞻性准备。 4)敏感信息的安全。 5)电子邮件和大数据等风险领域的管理。

  成功信息治理程序的原则如ARMA的GARP®原则。其他原则包括: 1)为问责制提供高层支持。 2)教育员工了解信息治理职责。 3)根据正确的档案代码或分类类目对信息进行分类。 4)确保信息的真实性和完整性。 5)确保官方档案是电子档案,除非另有规定。 6)制定制度,使业务系统和第三方与信息治理标准保持一致。 7)存储、管理、访问、监控和审核已批准的企业存储库以及档案和内容系统。 8)保护机密或个人身份信息。 9)控制不必要的信息增长。 10)在信息的生命周期结束时对其进行处置。 11)遵守信息的请求(如取证、传票等)。 12)持续改进。

在这里插入图片描述

  信息治理参考模型(IGRM)展示了信息治理与其他组织功能的关系。外环包括了实施信息管理过程中涉及的制度、标准、流程、工具和基础架构等方面,中心展示了一张生命周期图。IGRM是对ARMA的GARP®的补充。

6.2 信息的激增

  一般来说,非结构化数据的增长速度远远快于结构化数据,这增加了治理的难度。没有管理的非结构化数据,也不会有必需的元数据,这意味着存在风险。内容如果不为人知,可能会被曲解,也可能会被错误地处理或出现隐私问题。

6.3 管理高质量的内容

  文件和内容治理侧重于与保留、电子签名、报告格式和报告分发相关的策略,这些策略暗示或明示了对质量的期望。准确、完整和最新的信息将有助于做出决策。高质量的信息可以提高竞争优势和组织效率。定义高质量的内容需要了解它生产和使用的背景,如:

  • 1)生产者。谁创建内容?为什么要创建?
  • 2)消费者。谁使用信息?出于什么目的?
  • 3)时间。何时需要信息?需要多久更新或访问一次?
  • 4)格式。消费者是否需要特定格式的内容才能实现目标?是否有不可接受的格式?
  • 5)分发。信息将如何分发?消费者将如何获取信息?如何实施安全措施以防止对电子内容的不恰当访问?

6.4 度量指标

  关键业绩指标(KPI)是衡量组织绩效与目标的定量和定性指标。可以在战略和运营层面制定关键绩效指标。某些KPI可能同时适用于这 两个层面,尤其是在它们衡量生命周期功能或风险的情况下。

1.档案管理
  • 在战略层面,可以在档案管理法规遵从(如满足要求所花费的时间)和/或治理(如遵守制度)方面制定KPI。
  • 在运营层面,可以在档案管理资源(如运营和资本成本)、培训(如给定的类别数量、受过培训的员工数量及水平)、日常档案管理服务的提供与操作(如满足用户服务水平协议(SLA)的百分比)和/或档案管理功能与其他业务系统的整合(如集成的百分比)等方面制定KPI。
  • 衡量档案管理系统实施成功的标准如下:
    • 1)每个用户有百分之几的文件和电子邮件被认定为是公司的档案。
    • 2)被认定为公司档案中有百分之几得到了控制。
    • 3)在所有存储的档案中有百分之几的档案应用了适当的保管规则。
  • ARMA的GARP原则类别和成熟度模型可以指引KPI的定义。通过ARMA的信息治理评估软件平台可以识别与信息相关的合规风险,并在电子档案和电子取证(如诉讼保留)等方面制定治理规划成熟度的指 标。
2.电子取证
  • 电子取证常见的一个KPI指标是成本降低,另一个KPI指标是对比被动收集信息的方式,提前收集信息时提高的效率(如转为电子取证平均需要几天时间)。
  • EDRM模型可以根据每个阶段的需求来指引KPI的制定。
  • 电子取证工作主要集中在的7个方面(活动、监护人、系统、介质、状态、格式和质量保证)。
3.企业内容管理
  • 应制定KPI来衡量企业内容管理(ECM)的有形和无形效益。
    • 有形效益包括提高生产力、降低成本、提高信息质量和改善合规性;无形效益包括增进协作、简化工作程序和工作流。
  • 随着ECM的建立,KPI将侧重于规划和运营的指标。
    • 规划指标包括ECM项目数、采用率和用户满意度;运营指标包括一些典型的系统类型KPI,如停机时间、用户数量等。
  • 信息检索能力是通过查准率和查全率来衡量的。
    • 查准率是指检索到的文件与实际相关的比率,查全率是指检索到的涉及所有相关文档的比率。

7.总结

  • 文件和内容管理:是针对存储在关系型数据库之外的数据和信息的采集、存储、访问和使用过程的管理。重点在于保持完整性,确保可访问。确保安全和高质量,需要可靠的架构和管理良好的元数据。
  • 业务驱动因素: 法规遵从性要求、诉讼响应能力、电子取证请求能力、业务连续性要求。帮助提高组织效率。
  • 目标: 1)确保能够高速有效地采集和使用非结构化的数据和信息。2)确保结构化和非结构化数据之间的整合能力。3)遵守法律义务并达到客户预期。
  • 原则:1)组织中的每个人都应该在保护组织的未来方面发挥作用。每个人都必须按照既定的制度和程序来创建、使用、检索和处置档案。2)档案和内容处理方面的专家应充分参与制度和规划的制定。
  • ARMA 国际在 2009 发布的档案保存指导原则 GARP:1)问责原则。2)完整原则。3)保护原则。4)遵从原则。5)可用原则。6)保留原则。7)处置原则。8)透明原则。
  • 非结构化内容元数据: 格式。可搜索性。自我描述性。既有模式。内容主题。需求。
  • 内容建模: 将逻辑内容概念转换为具有关系的内容类型、属性和数据类型的过程。分为信息产品级别、组件级别两个层次。
  • 内容分发方法: 1) 推式,如 RSS。2) 拉式,如访问淘宝。3) 交互式,如企业应用程序集成 EAI、更改数据采集、数据集成和 EII。
  • 受控词表:被明确允许用于通过浏览和搜索对内容进行索引、分类、标引、排序和检索术语的定义列表。词汇表管理关键问题集中于用途、消费者、标准、维护 4 个方面。
  • 词汇表视图 (Vocabulary View) 是受控词表的子集,涵盖了受控词表领域内有限范围的主题。
  • 微控制词汇表(Micro-Controlled Vocabulary) 是包含一般词汇表中不包含的高度专业化术语的词汇表。
  • 术语管理包括在受控词汇表中建立术语之间的关系。关系的类型:1)等价术语关系(Equivalent Term Relationship)。2)层次化关系(Hierarchical Relationship)。它描述广义(一般)到狭义(特定)或整体-部分的关系。3)关联关系(Related Term Relationship)。与受控词表中的另一个术语相关联,但这种关联不是层次化的。
  • 文件(Document) 是包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等的电子或纸质对象。文件可用于交流并分享信息和知识。只有部分文件才能称为档案(Record)。档案可用于证明所做的决策和所采取的行动是符合程序的;可作为组织业务活动和法规遵从的证据。档案通常是由人来创建的,但仪器和监控设备也可以提供数据来自动生成档案。
  • 文件管理包括在文件和档案的整个生命周期中控制和组织它们的流程、方法和技术。它包括电子和纸质文件的存储、编目和控制。关注文件本身,几乎不关注文件内容。市场和监管压力都将重点放在档案保管期限表、地点、传送和销毁上。
  • 管理文件和档案的生命周期:编目。制度。分类。存储。检索和流传。保存和处置。
  • 信息架构是为信息体或内容创建的结构。它包括以下组件:1)受控词表。2)分类法和本体。3)元数据映射。4)搜索功能规格。5)用例。6)用户流。信息架构和内容制度共同描述了“什么”,即哪些内容将在系统中被管理。设计阶段描述了“如何”实施内容管理制度。
  • 语义建模: 一种知识建模,描述一系列概念网络(有关的想法或主题)以及它们之间的关系。
  • 语义模型包含语义对象和语义约束。语义对象是模型中表示的事物,它们可以具有基数和域的 属性以及标识符。它们的结构可以是简单的、合成的、复合的、混合的、关联的、父/子类型或 原型/版本。语义约束表示 UML 中的关联或关联类模型,这些模型有助于识别模式和趋势,并发现可能看起来不相干信息之间的关系。
  • 语义搜索(Semantic Search) 侧重于语义和语境而非预先设定的关键字。可使用人工智能。要弄清用户想要什么。
  • 多达 80%的数据存储是在关系型数据库之外维护。工作流程需要具有可重复执行的能力,在理想情况下包含对种内容通用的流程步骤。
  • 【活动 1】规划生命周期管理: 1.规划档案管理。(什么是档案。存在哪?老旧档案 处置?) 2.制定内容策略。(从当前状态审视和差距评估开始。元数据分类和 SEO)
  • 【活动 2】创建内容处理制度,多数文件管理制度有 1)审计的范围和合规性。2)重要档案的鉴定和保护 3)保留档案的目的和保管期限表。4)如何响应信息保留命令(特殊保护令),即 针对已过保留期的诉讼信息要求。5)本地和异地存储档案的要求。6)硬盘驱动器和共享网络驱动器的使用和维护。7)对电子邮件管理,从内容管理的角度进行处理。8)合理的档案销毁方法。
  • 【活动 3】定义内容信息架构。 需要从结构和非结构化的数据中,检索出用户需要的信息。
  • 【活动 4】实施的生命周期管理: 1.获取档案和内容。2.管理版本控制。3.备份和恢复。4.管理保管和处置。5.审计文件/档案。
  • 【活动 5】发布和分发内容: 1.开放访问、搜索和检索。2.通过可接受的渠道分发。
  • ANSI 859 标准基于数据的重要性及数据损坏或不可用时可能造成的损害,将数据控制分为 3个等级:正式控制、修订控制、托管控制
  • 工具: 企业内容管理系统(文件管理、内容管理系统、内容和文件工作流)。协作工具。受控词汇表和元数据工具。标准标记和交换格式(XML、JSON、RDF 和 W3C、Schema.org)。电子取证技术。
  • 方法:诉讼应诉手册。诉讼应诉数映射(90 天限制)。
  • 企业内容管理ECM就绪评估的目的:确定内容管理需要改进的方面,以及组织对改变其流程以满足这些需求的适应程度。
  • ARMA 有一个信息治理成熟度模型
    • 1)1级,低于标准的(Sub-Standard)。信息治理和 档案保管问题没有得到解决或只是最低限度的解决。
    • 2)2级,发展中的(In Development)。认识到信息治理和档案保管可能对组织产生的影响。
    • 3)3级,基本的(Essential)。必须满足法律法规的最低要求。
    • 4)4级,积极的(Proactive)。已经建立了一个以持续改进为重点的主动式信息治理计划。
    • 5)5级,完成变革的(Transformational)。信息治理已经融入企业的基础架构和业务流程中。
  • 信息治理参考模型 IGRM: 展示信息治理与其他信息功能的关系。
  • 非结构化数据的增长速度远远快于结构化数据。管理非结构化数据需要数据管理专员与其他数据管理专业人员、档案管理人员的有效合作
  • 度量指标:
    • 1.档案管理:ARMA 的 GARP 原则类别和成熟度模型可以指引 KPI 的定义。标准:1)每个用户有百分之几的文件和电子邮件被认定为是公司的档案。2)被认定为公司档案中有百分之几得到了控制。3)在所有存储的档案中有百分之几的档案应用了适当的保管规则。然后将以 上百分比进行比较,以确定出最佳实践的百分比值。
    • 2.电子取证: 成本降低、对比被动收集信息的方式,提前收集信息时提高的效率(如转为电子取证平均需要几天时间)、组织可以快速地 进行法律保留通知的过程。
    • 3.企业内容管理:衡量企业内容管理(ECM)的有形和无形效益。有 形效益包括提高生产力、降低成本、提高信息质量和改善合规性;无形效益包括增进协作、简 化工作程序和工作流。
  • 11
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值