GITHUB代码永久保存计划

代码永久保存计划

目前,大量的知识存储在临时媒体设备上:硬盘、SSD、CD 可以使用数十年,备份磁带名义上只有 30 年的寿命,还得严格控制热量和湿度。即便未来这些硬件还在,但运行在上面的软件可能早已被淘汰, GitHub Archive Program 计划有更长远的打算,以解决数据在未来丢失的风险。

GitHub(以下各存储方案按热度排列,GitHub 为热门项目首选)

每次访问 GitHub,GitHub 都会将 Git 数据复制到世界各地的多个数据中心。此外,在 Git 的多个位置存储数据、问题、拉取请求以及数据备份,所有这些都可通过 GitHub API 实时获得。

GHTorrent

GHTorrent 监视 GitHub 公共项目的时间线,并进行归档,递归爬取归档内容和依赖性。这些存档每天或每月可供下载。

GH Archive

GH Archive 监视 GitHub 公共事件时间轴,将这些事件归档,并使用 BigQuery 使它们可查询。开发者可以按小时、天或月下载快照。

Wayback Machine

互联网档案馆 Wayback Machine 将检索 GitHub 的公共资料库(包括新的资料库、问题、拉取请求、Wiki 等),并将副本存储在旧金山和其他位置的硬盘上,这些档案将通过 git 和 https 公开提供。

Software Heritage Foundation

Software Heritage Foundation(软件遗产基金会)将定期抓取 GitHub,并将其公共存储库添加到存档中,并向其提供公共 API 访问权限。

Bodleian 图书馆

牛津大学的 Bodleian 图书馆将 GitHub 的 10,000 个最受关注和最依赖的存储库保留为 Piql 胶片格式,从而为 Arctic Code Vault 提供冗余。

GitHub Arctic Code Vault(北极)

2020 年 2 月 2 日,GitHub 会对每个活跃的公共存储库进行快照捕获,并保存在 GitHub Arctic Code Vault 中。存储所使用的胶片卷轴长达 3500 英尺,由专门负责研发超长期数据保存技术的挪威 Piql 公司提供并编码,其中的薄膜使用卤化银聚酯技术。根据 ISO 标准,这种介质的使用寿命长达 500 年;同时,老化模拟测试表明,其使用时长也能达到原来的两倍。

这是位于北极世界档案馆(AWA)中的数据存储库,位于北极山永久冻土区深 250 米。该档案馆位于斯瓦尔巴群岛的一个废弃煤矿中,比北极圈更靠近北极。 GitHub 将在 2020 年 2 月 2 日捕获每个活动公共存储库的快照,并将这些数据保存在 Arctic Code Vault 中。

斯瓦尔巴群岛受国际《斯瓦尔巴群岛条约》的管制,属于非军事区,是世界上最北端的城镇所在地,地球上最偏远和地缘政治最稳定的人类居住地之一。AWA 是挪威国有采矿公司 Store Norske Spitsbergen Kulkompani(SNSK)与长期数字存储提供商 Piql AS 的一项联合计划。 AWA 致力于永久保存档案,胶片卷轴将被存储在位于斯瓦尔巴群岛偏远群岛一座废弃煤矿密封室内的钢壁容器中。

尽管斯瓦尔巴群岛受到气候变化的影响,但在可预见的将来,可能只会影响到最外面几米的永久冻土,预计变暖不会威胁稳定性。矿山靠近著名的 Global Seed Vault(仅一英里之遥),这增强了斯瓦尔巴群岛作为人类集体知识的稳定且长期的档案馆地位。

存档在 GitHub Arctic Code Vault 中的 02/02/2020 快照将包括所有活动的公共 GitHub 存储库,此外还包括由星号、依赖项和咨询小组确定的大量休眠存储库。快照将由每个存储库的默认分支的 HEAD 减去任何大于 100KB 的二进制文件组成,每个存储库将打包为一个 TAR 文件。

为了提高数据密度和完整性,大多数据将以 QR 编码存储。易于阅读的索引和指南将逐项列出每个存储库的位置,并说明如何恢复数据。

微软研究院的 SILICA 项目

GitHub 存档计划与 Microsoft 的 Silica 项目合作,通过使用飞秒激光(目前科技条件下所能获得的最短脉冲激光)将所有活动的公共存储库写入石英玻璃片中,最终将其保存超过 10,000 年。

腾讯云11.11爆款1核2G云服务器首购88元,免费领9888元代金券,百款云产品一折起

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值