又见“罗塞塔”,艾利贝斯罗塞塔系统

关注我们 - 数字罗塞塔计划 -

之前笔者写过一篇文章《寻找不同的“罗塞塔”,终于找到一个志同道合的项目!》,介绍了恒今基金会的罗塞塔计划—一个研究语言档案长期保存的项目。近日,笔者又惊喜地发现一个同处信息化领域且同样是研究数字资源长期保存的“罗塞塔”项目——艾利贝斯罗塞塔系统(Ex Libris Rosetta)。

图片

01 系统概述

● 艾利贝斯罗塞塔系统(Ex Libris Rosetta)

随着数字技术的飞速发展,图书馆、档案馆和博物馆等机构面临着海量数字资源永久保存的难题。这些机构不仅需要储存成千上万的实体物品和实物资源,还需确保大量日益新增的数字资源得到妥善保存,以实现数字资源长期保存及传承后世的目标。然而,许多机构的存储系统并未充分考虑数字内容的持续可用性和可访问性。

以色列艾利贝斯(Ex Libris)公司研发了罗塞塔系统(The Rosetta System),支持图书馆、档案馆和博物馆等机构持续收集和保存数字内容,以便于将来继续使用。目前,全球已有数十家机构采用该系统,它配备了一套独特的数字资源保存模块,协助机构识别格式风险、评估缓解替代方案以及实施保存策略,确保数字内容的长期保存和可访问性。

02 系统功能介绍

● 艾利贝斯罗塞塔系统(Ex Libris Rosetta)

2.1 功能架构

罗塞塔系统建立在开放档案信息系统(Open Archival Information System, OAIS)模型(参见本公众号文章《OAIS模型及其数字资源长期保存要求》)的基础上,并遵循可信赖仓储的审计与认证(Trustworthy Repositories Audit and Certification, TRAC)(参见本公众号文章《可信数字仓储(TDR)及其实践应用案例》)。系统包括收集(Ingest),保存(Preservation),工作区域(Working Area), 操作存储库(Operational Repository), 管理(Management),永久存储库(Permanent Repository),交付(Delivery)和发布(Publishing)八个功能模块,系统功能架构如下图所示。

图片

模块功能分别介绍如下:

  • 收集模块

该模块允许外部用户(发布者、最终用户)或内部用户(机构工作人员)上传和保存提交信息包(SIP),以便提交信息到工作区域中。

  • 保存模块

该模块包括格式库、风险分析、评估和保存操作。该模块允许机构管理完整的保存策略,以识别风险,在可能的替代解决方案中选择最佳方案,并测试/激活首选的保存策略。

  • 工作区域

该模块和操作存储库配合使用,用于管理已提交给系统的SIP及其包含的元数据和文件内容,并在OAIS框架下生成符合文件格式和元数据标准的保存信息包(AIP)。

  • 操作存储库

系统提供一个允许搜索、索引和快速访问的操作存储库。各种针对数字内容的增删改查等操作都在本模块进行,批准为永久保存的数字资源会进入永久存储库。

  • 永久存储库

永久存储库旨在存储经批准永久保存的数字资源内容,遵循只写一次和完整磁盘复制策略,存储在永久存储库中的内容无法更新、删除或重新排列,以确保数字资源的绝对安全。

  • 管理模块

系统提供基于Web的界面,用于管理整个保存系统和数字资源。管理模块包括执行维护任务、元数据编辑、搜索和其他任务的功能。

  • 利用模块

在利用模块中创建了分发信息包(DIP),用于发布存储在永久存储库中的信息。利用模块由两个组件组成:

发布组件

允许外部系统使用标准的通信协议,如OAI-PMH、通过URL进行搜索/检索(SRU)或搜索/检索Web服务(SRW),来访问存储在永久存储库中的数据。

交付组件

通过系统的一部分(例如,视频流服务器)或第三方应用程序提供的查看器,向用户提供所需的DIP。系统会处理项目交付请求,并在将项目交付给用户之前检查为其定义的访问权限。

2.2 系统信息流

罗塞塔系统的信息流示意图如下所示:

图片

系统信息流包括以下几个阶段:

(1)生产者登录到罗塞塔系统。

(2)生产者通过收集服务器上传文件。

(3)罗塞塔系统将生产者上传的内容移动到操作服务器,该服务器通过 SIP 处理模块处理内容。经过系统验证的SIP可供管理者使用,管理者使用基于 Web 的界面查看内容,并决定是否需要批准、返回给生产者修改或拒绝。

(4)管理者批准 SIP 后,系统将生成的AIP移动到永久存储库。在永久存储库中,一般不再保留SIP中的数字对象内容,但可以保留一份元数据作为今后比对之用。

如前所述,永久存储库中的AIP无法更新、删除或重新排列。当必须更改AIP 时(例如,其元数据或格式需要更新),罗塞塔系统会将其移回操作服务器。更新过程完成后,系统再将 AIP返回到永久存储库,并记录更新过程。

(5)最后,由“交付模块”和“发布模块”通过接口将内容从罗塞塔系统传送到内容使用者。内容使用者可以在只读模式下搜索和查看内容。他们通过公共接口(例如图书馆的在线公共访问目录OPAC)访问存储库内容,他们可访问的内容由管理者和生产者定义(访问权限选项)。

03系统特点介绍

● 艾利贝斯罗塞塔系统(Ex Libris Rosetta)

罗塞塔系统是一个网络应用程序,可通过Microsoft Internet Explorer、Mozilla Firefox和Google Chrome等主流浏览器访问。系统提供了完善的安全、审计和完整性检查功能,以确保已采集馆藏资源的长期安全保存。

3.1 对元数据标准的遵守

在罗塞塔系统的开发过程中,一个关键的指导原则是确保该解决方案符合数字保存的国际标准。系统数据模型能够足够灵活地管理不同类型的数字内容,包括:文本文档、图像、音视频文件等。其目标是创建一个数据模型:

● 支持一个可供长期数字保存的结构和元数据;

● 支持各种文件格式的数字内容;

● 支持各种有保存需要的机构类型(图书馆、档案馆、博物馆);

● 符合标准和开放的实践。

罗塞塔系统的数据模型基于长期保存元数据实现策略PREMIS(有关PREMIS的详细介绍参见本号文章《PREMIS(保存元数据:实施战略)项目介绍》)以及元数据编码和传输标准(METS)。

PREMIS是一个描述长期保存所需实体和元数据的概念模型。PREMIS元数据元素以三种不同的类别(管理元数据、描述元数据和结构元数据)存储在罗塞塔系统 METS容器中。元数据和文件按照一定的结构组织,如下图所示:

图片

3.2 可扩展的基础设施

罗塞塔系统为保存机构提供了一套灵活且可扩展的基础设施,以应对不断增加的数字资源保存和管理需求。这一解决方案基于健壮的分布式架构,允许将存储模块、工作区域、永久存储库以及数据库分别部署在独立的服务器上。此外,各模块均可通过添加额外计算资源和存储资源实现扩容。罗塞塔系统还支持引入专用服务器,执行特定任务,如病毒检测和固化特性检查。这种灵活性使得保存机构能够从较小的硬件配置起步,并根据不断增长的馆藏需求调整系统配置。

图片

3.3 灵活的开放平台

罗塞塔系统支持不同类型数字资源的采集、确认、接收、存储、管理、保存和发布,当相关政策发生变化时,还支持这些数字资源从一个机构转移到另一个机构。数字资源将会被保存为长期可用的格式,之后还需不断对保存格式进行评估,必要时进行转换迁移,以确保其持续的可用性。

罗塞塔系统的体系结构与基于规则的工作流引擎相结合,除了能为保存机构提供开箱即用的工具之外,还支持使用插件工具和应用程序来优化系统功能。这些工具支持以下任务和活动:

(1)接口丰富

系统提供丰富的API和SDK,支持与现有的应用程序进行集成,实现两者的无缝对接。

(2)工具集成

支持外部第三方工具,如JHOVE、DROID和病毒检查应用程序嵌入到罗塞塔系统中,以确保系统中的信息是可读的,并且未损坏。一旦有新工具出现或发展,可继续纳入集成范围。

(3)格式转换

基于规则的转换方案由一个工作流引擎进行管理,允许嵌入各种格式转换工具,在触发转换条件时对AIP中的文件内容进行格式转换——例如,将AVI格式转换为MP4格式。

(4)开放利用

系统提供一套DIP发布SDK,能够轻松地集成到用于数字版权管理、利用服务平台和知识发现的本地系统中,实现数字内容的开放利用。

3.4 强大的社区知识库

罗塞塔系统的核心特性之一是社区驱动的知识库。该知识库由罗塞塔系统用户社区负责管理与更新,旨在共享并存储关于文件格式、应用程序、技术元数据及风险控制等方面的知识点。在社区知识库,每个客户都可以基于罗塞塔系统共享与其他客户的信息,创建保护计划,执行保存行动,并能及时获得社区反馈。

图片

04 应用案例

● 艾利贝斯罗塞塔系统(Ex Libris Rosetta)

罗塞塔系统在图书馆、档案馆、博物馆等领域具有较为广泛的应用,这些机构可以使用该系统来保存和管理工作中产生的各种具有保存价值的数字资源,如历史文档、照片、音频和视频等。同时,文化遗产机构通过使用罗塞塔系统可以确保珍贵的历史资料得到长期保存和妥善管理,使人类文明得以传承。另外,罗塞塔系统还是帮助学术机构提供长期数据访问的理想合作伙伴。

罗塞塔系统的全球客户分布图如下所示:

图片

目前,全球已有数十家机构采用该系统,包括:

巴伐利亚州立图书馆

主要项目:图书数字化成果的保存。

戈波尔蒂斯联盟

(ZBW-莱布尼茨经济信息中心;德国国家科学技术图书馆[汉诺威];德国国家医学图书馆[ZB MED])

主要项目:视听媒体的保存。

苏黎世联邦理工学院

艾利贝斯公司的大学合作伙伴。

主要项目:研究数据的长期保存。

撒克逊州立和大学图书馆(SLUB)

主要项目:保存萨克森大学的文化遗产数字资源和数字出版物。

宾汉姆顿大学

主要项目:特殊藏品的数字保存。

美国犹他大学

主要项目:文化遗产收藏品的数字保护。

罗塞塔系统作为一个完整的数字资源管理和保存系统,已经在多个领域取得了较为广泛的应用。随着数字化浪潮席卷而来,罗塞塔系统在未来的应用前景将更加广阔,助力数字资源的长期保存和高效利用。

他山之石可以攻玉,数字资源长期保存是数字罗塞塔计划项目的核心研究内容。经过三年的持续研发,数字罗塞塔计划项目已推出包括蓝光存储、数字胶片、电子档案库房等在内的全套数字资源长期保存软硬件产品及解决方案,旨在解决电子档案乃至数字资源长期保存领域的国产化替代问题,以实现“保存社会记忆,传承人类文明”的最终目标。

END

数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!

关注我们 - 数字罗塞塔计划 -

  • 23
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数字罗塞塔计划

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值