网络资源归档标准WARC介绍

WARC(Web ARChive)是网络资源存档的国际标准格式,由IIPC资助,IA开发,适用于长期保存网络资源。WARC是对ARC格式的升级,详细记录HTTP请求头信息和元数据,支持多种协议,广泛应用于各大图书馆和档案馆。它具有完善的软件生态环境,记录丰富的信息,支持打包压缩,易于扩展,并被采纳为中国的国家标准。
摘要由CSDN通过智能技术生成


 

WARC---Web ARChive

01

● WARC格式概述 

WARC(Web ARChive)格式是网络资源存档中使用的常见文件格式,全称为Web Archive File Format,由互联网保存联盟(International Internet Preservation Consortium,IIPC)资助,互联网档案馆(Internet Archive,IA)等机构负责开发,于2009年5月成为正式国际标准,标准号为ISO 28500:2009 Information and documentation — WARC file format。2017进行过一次修订,标准号为ISO 28500:2017

 

WARC文件格式是唯一面向网络资源长期保存的资源保存格式,在世界各国的图书馆和档案馆得到了广泛的应用(比如美国互联网档案馆、澳大利亚国家图书馆、日本国立图书馆、荷兰国家图书馆、英国国家档案馆等),具有软件生态环境完善、内容丰富、便于管理、易于扩展、支持大容量文件保存等突出优点,同时适合网络资源和数字资源的长期保存使用。由于其广泛而巨大的影响力,该标准于2017年被采标为中国国家标准:GB/T 33994-2017《信息和文献 WARC文件格式》。

 

WARC格式是ARC(ARChive)格式的延续。ARC格式由互联网档案馆IA在1996年完成开发,规定了一种将多个数字资源整合到一个存档文件中的方法,用于管理IA所保存的数以亿计的网络文档。

IA在后来的工作中逐渐发现,ARC格式无法满足网络资源存档进一步的要求,因此开始在ARC格式的基础上开发新的格式,后来确定为WARC格式。相对于之前的格式,WARC

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值