1. 定义
-
文件和内容管理是指针对存储在关系型数据库之外的数据和信息的采集、存储、访问和使用过程的管理
-
文件管理没问题 难的是:内容管理 (因为NLP还不成熟) natural language processing
-
结构化和非结构化数据都是需要管理的
2. 主要业务驱动因素
-
法规遵从性要求
-
诉讼响应能力
-
电子取证请求能力
-
业务连续性要求
3. 目标
-
确保能够高速有效地采集和使用非结构化的数据和信息
-
确保结构化和非结构化数据之间的整合能力
-
遵守法律义务并达到客户预期
4. 文件和档案
文件(Document)是包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等的电子或纸质对象。
文件大于档案 并非所有的文件都称为档案 ,只有部分文件才能成为档案(Record)
文件管理
-
文件管理关注的是文件本身,几乎不关注文件内容
-
一个文件中的信息内容可能对如何管理该文件有指导性作用,但是在文件管理中,文件被视为一个单独的实体
-
市场和监管压力都将重点放在档案保管期限表、地点、传送和销毁上
-
数据管理专业人员是文件分类和保管决策中的利益相关方,他们必 须支持基础结构化数据与特定非结构化数据之间的一致性
档案管理
精心管理的档案管理
-
1)内容。内容必须准确、完整和真实。
-
2)背景。关于档案的创建者、创建日期或与其他档案关系的描述性信息(元数据)应该在创建档案时收集、组织并维护。
-
3)及时性。档案应该在事件、行为或决定发生后立即创建。
-
4)永久性。一旦成为档案,则在档案的法定保存期内不能改变其内容。
-
5)结构。档案内容的外观和排版需要清晰,它们应被记录在正确的表格或模板上。内容应清晰易读,对术语的使用应始终保持如一。
档案管理成熟度5级
-
1级,低于标准的(Sub-Standard)。信息治理和档案保管问题没有得到解决或只是最低限度的解决。
-
2级,发展中的(In Development)。认识到信息治理和档案保管可能对组织产生的影响。
-
3级,基本的(Essential)。必须满足法律法规的最低要求。
-
4级,积极的(Proactive)。已经建立了一个以持续改进为重点的主动式信息治理计划。
-
5级,完成变革的(Transformational)。信息治理已经融入企业的基础架构和业务流程中。
5 非结构化数据
非结构化数据有多种电子格式:文字处理文件、电子邮件、社交媒体、聊天室、平面文件、电子表格、XML文件、事务性消息、报告、图形、数字图像、缩微胶片、视频和音频。纸质文件中也存在大量非结构化数据
6. 非结构化数据内容的元数据
-
格式
-
可搜索性
-
自我描述性
-
既有模式
-
内容主题
-
需求
8.例题 根据 DMBOK2,实施文件和内容管理最佳实践的目标不包括以下哪个选项?© A. 确保能够高速有效地的采集和使用非结构化的数据和信息 B. 确保结构化和非结构化数据之间的整合能力 C. 实现非结构化数据的统一管理,提升安全性。 D. 遵守法律义务并达到客户预期 根据 DMBOK2,以下关于文件管理的描述,哪个选项是不正确的?(D) A. 一般来说,文件管理关注的是文件本身,几乎不关注文件内容。 B. 一个文件中的信息内容可能对如何管理该文件有指导性作用,但是在文件管理中,文件被视为一个单独的实体。 C. 市场和监管压力都将重点放在档案保管期限表、地点、传送和销毁上。 D. 数据管理专业人员不是文件分类和保管决策中的利益相关方 P238档案管理前两段第一句话: 数据管理专业人员是文件分类和保管决策中的利益相关方,他们必须支持基础结构化数据与特定非结构化数据之间的一致性