Hadoop 2.1.0 beta HDFS SnapShot 介绍

最新推荐文章于 2024-09-11 10:30:00 发布

老钱的人工智能探索

最新推荐文章于 2024-09-11 10:30:00 发布

阅读量129

点赞数

分类专栏：大数据hadoop 文章标签： Hadoop 2.0 hadoop HDFS 大数据

大数据hadoop 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Hadoop 2.1.0 Beta 版 HDFS 提供了SnapShot 模块。用于数据备份、回滚。已防止因用户的失误操作导致集群出现问题。本文先做一个简单的介绍，其他的文章在来介绍Snapshot 本身的实现机制。

首先

HDFS 的Snapshot 大概有以下几个特性：

Snapshot 创建的时间复杂度为O(1)，但是不包括INode 的寻找时间
只有当修改SnapShot时，才会有额外的内存占用，内存使用量为O(M),M 为修改的文件或者目录数
在datanode 上面的blocks 不会复制，做Snapshot 的文件是纪录了block的信息
Snapshot 并不会影响HDFS 的正常操作

然后，有以下的几个新的概念来产生

Snapshot table

Snapshots 会存储在snapshottable的目录下。snapshottable下存储的snapshots 最多为65535个，

Snapshot 路径

举例，假设/foo 是snapshottable，/foo/bar 是文件目录,/foo 拥有一个s0的snapshot

那么路径会是 /foo/.snapshot/s0/bar

我们可以通过 hdfs dfs -ls /foo/.snapshot

hdfs dfs -ls /foo/.snapshot/s0

hdfs dfs -cp /foo/.snapshot/s0/bar /tmp

来操作与查看副本文件。

最后，让我们来看下基本操作的介绍

Snapshot 基本操作

对一个路径开启Snapshot
- hdfs dfsadmin -allowSnapshot <path>
关闭 Snapsshots
- hdfs dfsadmin -disallowSnapshot <path>
创建Snapshosts
hdfs dfs -createSnapsshot <path> [snapshot names]

删除Snapshots
hdfs dfs -deleteSnaphost <path> <snapshotName>

修改Snapshots的名字
- hdfs dfs -renameSnapshot <path> <oldname> <newname>
获取Snapshot 列表
- hdfs lsSnapshottableDir
获取两个Snapshot的不同
- hdfs snapsshotDiff <path> <fromSnapshot> <toSnapshot>

文章资料来源：http://hadoop.apache.org/docs/r2.1.0-beta/hadoop-project-dist/hadoop-hdfs/HdfsSnapshots.html

老钱的人工智能探索

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。