Hadoop入门+HDFS命令

最新推荐文章于 2024-02-26 22:00:58 发布

薇酱

最新推荐文章于 2024-02-26 22:00:58 发布

阅读量1.7k

点赞数 2

分类专栏： Hadoop 文章标签： hdfs 大数据 hadoop

Hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Hadoop的核心是HDFS和MapReduce

1.HDFS的特点是，适合于

1）大数据

2）硬件廉价

3）高容错性

4）文件分块存储

5）流式数据访问，不支持动态改变文件内容

它的关键元素有：

Block：一般大小为64M,

NameNode：保存整个文件系统的目录信息，分块信息，文件信息，由唯一一台主机专门保存，在Hadoop2*版本中支持activity-standy模式，当这个NameNode失效时，会启用备用主机启动NameNode

DataNode：分布在廉价的计算机上，用于存放Block块文件的

2.一些HDFS的命令：

1.列出HDFS文件

bin/hdfs dfs -ls

2.列出HDFS下某个文件目录下的文件

bin/hdfs dfs -ls home/a

3.列出HDFS下某个文件的内容

bin/hdfs dfs -cat home/a/file1

4.将文件file1上传到HDFS上并且重命名为file2

bin/hdfs dfs -put file1 file2

5.将文件file2下载到本地，并且命名为file1

bin/hdfs dfs -get file2 file1

6.删除HDFS下的文档

bin/hdfs dfs -rmr home/a/file1

7.查看报告

bin/hdfs dfsadmin -report

8.进入安全模式

bin/hdfs dfsadmin -enter

9.退出安全模式

bin/hdfs dfsadmin -leave

3.MapReduce

MapReduce分为Map和Reduce两个部分，我的理解是Map将任务分为一个个子任务分发到各个计算机上，Reduce则将Map后的一个个子任务的结果，merge在一起，找到原本任务的答案。

http://blessht.iteye.com/blog/2095675

http://blog.163.com/ppy2790@126/blog/static/10324224120137353834805/

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop入门+HDFS命令

Hadoop的核心是HDFS和MapReduce1.HDFS的特点是，适合于1）大数据2）硬件廉价3）高容错性4）文件分块存储5）流式数据访问，不支持动态改变文件内容它的关键元素有：Block：一般大小为64M,NameNode：保存整个文件系统的目录信息，分块信息，文件信息，由唯一一台主机专门保存，在Hadoop2*版本中支持activity-stan
复制链接

扫一扫

专栏目录

薇酱 CSDN认证博客专家 CSDN认证企业博客

码龄10年

66: 原创

31万+: 周排名

1万+: 总排名

17万+: 访问

: 等级

1910: 积分

172: 粉丝

283: 获赞

17: 评论

510: 收藏

私信

关注

热门文章

分类专栏

学习框架 6篇
跟着chatgpt一起学 12篇
深度学习 9篇
经典算法介绍 9篇
AIGC 4篇
excel 1篇
Hadoop 2篇
问题解决 8篇
机器学习 12篇
算法 4篇
hive 4篇
poj水题 16篇
环境问题 2篇
python第三方库 2篇
spark 2篇
NLP 5篇

最新评论

分布式执行引擎ray入门--（1）简介
CSDN-Ada助手: 不知道云原生入门技能树是否可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
半监督短语挖掘：autophrase是什么？
薇酱: pages-articles.xml.bz2，这个在git上有说，https://github.com/kno10/WikipediaEntities
半监督短语挖掘：autophrase是什么？
lily_d_nlp_mt_istic: 你好，请问wiki数据用哪一个
图片是如何生成的--图像生成模型（GAN、VAE、扩散模型）简介
薇酱: GAN的可解释性通常较差，主要原因是它们的训练过程是一种黑箱操作。在训练GAN时，我们通常只关心生成器是否可以生成出与真实数据类似的数据，而不关心潜在空间中的变量到底代表了什么。因此，GAN的潜在空间通常没有明确的语义解释。另一方面，VAE的可解释性通常较好。VAE是一种基于概率的生成模型，它们的训练过程涉及到对潜在变量的后验分布进行建模。因此，我们可以通过观察和分析潜在变量的分布来理解模型的行为。此外，VAE的训练过程还包括一个重构误差项，这使得我们可以更好地理解潜在空间中的变量和它们如何影响生成的数据。 --以上回答来源于chatgpt，希望能帮到你
图片是如何生成的--图像生成模型（GAN、VAE、扩散模型）简介
不知道取啥名好: 大佬能请教你一下为什么是说gan模型可解释性不如VAE

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。