Hadoop 学习第二天

最新推荐文章于 2024-05-13 20:51:18 发布

白日碧玉

最新推荐文章于 2024-05-13 20:51:18 发布

阅读量261

点赞数 3

文章标签： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/g2735669178/article/details/138140905

版权

一、常用Linux命令的基本使用
序号   命令   对应英文   作用
01   ls   list   查看当前文件夹下的内容
02   pwd   print work directory   查看当前所在文件夹
03   cd[目录名]   changge directory   切换文件夹
04   touch[文件名]   touch   如果文件不存在，新建文件
05   mkdir[目录名]   make directory   创建目录
06   rm[文件名]   remove   删除指定文件
07   clear   clear   清屏

二、HDFS架构概述
Hadoop Distributed File System，简称HDFS，是一个分布式文件系统。

随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。

HDFS的使用场景：适合一次写入，多次读出的场景。一个文件经过创建、写入和关闭之后就不需要改变。

优缺点
优点
1）高容错性

数据自动保存多个副本。它通过增加副本的形式，提高容错性。
2）适合处理大数据

数据规模：能够处理数据规模达到GB、TB、甚至PB级别的数据；
文件规模：能够处理百万规模以上的文件数量，数量相当之大。
3）可构建在廉价机器上，通过多副本机制，提高可靠性。

缺点
1）不适合低延时数据访问，比如毫秒级的存储数据，是做不到的。

2）无法高效的对大量小文件进行存储。

存储大量小文件的话，它会占用NameNode大量的内存来存储文件目录和块信息。这样是不可取的，因为NameNode的内存总是有限的；
小文件存储的寻址时间会超过读取时间，它违反了HDFS的设计目标。
3）不支持并发写入、文件随机修改。

一个文件只能有一个写，不允许多个线程同时写；
仅支持数据append（追加），不支持文件的随机修改。

三、Hive入门

Hive：由Facebook开源用于解决海量结构化日志的数据统计。

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。

本质是：将HQL转化成MapReduce程序

1）Hive处理的数据存储在HDFS

2）Hive分析数据底层的实现是MapReduce

3）执行程序运行在Yarn上

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hadoop 学习第二天

随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。这样是不可取的，因为NameNode的内存总是有限的；HDFS的使用场景：适合一次写入，多次读出的场景。小文件存储的寻址时间会超过读取时间，它违反了HDFS的设计目标。1）不适合低延时数据访问，比如毫秒级的存储数据，是做不到的。它通过增加副本的形式，提高容错性。文件规模：能够处理百万规模以上的文件数量，数量相当之大。
复制链接

扫一扫

白日碧玉 CSDN认证博客专家 CSDN认证企业博客

码龄2年

3: 原创

190万+: 周排名

20万+: 总排名

845: 访问

: 等级

39: 积分

9: 粉丝

9: 获赞

0: 评论

6: 收藏

私信

关注

热门文章

最新评论

实训项目代码
CSDN-Ada助手: 恭喜用户发布了第三篇博客“实训项目代码”！持续创作是提升自己技术能力的好方法，希望您能坚持下去，分享更多精彩的内容。建议您在下一篇博客中可以深入分析实训项目中遇到的问题及解决方法，或者分享一些实用的编程技巧，让读者受益匪浅。期待您更加精彩的创作，加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。