hadoop学习笔记

ls 命令查看详细,用于列出目录里的内容。

ll 相当于ls-l。

在linux系统中,在终端中输入并执行命令时,这些命令实际上是shell命令。

访问HDFS:

生产环境中使用Hadoop 3.3.0版本 HDFS的web界面端口号是 9870

Hadoop 2.0版本 HDFS的Web界面端口号是50070

Hadoop 3.0及以上版本 HDFS的web界面端口号是 9870

生产环境中使用Hadoop 3.3.0版本 HDFS的web界面端口号是 9870

YARN 2.0及以上版本  ResourceManager的Web界面端口号是8088

日志查看 Web界面的端口号是19888

bin 放运行文件的

cd - 返回上一层操作的地方,上一个访问的目录。

与cd ..做区别

cd .. 返回上一级目录,当前目录的父目录。

etc 一般存放的是系统上的配置文件

lib 程序运行时需要的依赖文件

Jar包  与java相关

杀死一个脚本或进程 kill命令

关机命令 shutdown -h now

重启系统 reboot

Apach hive

Hive是hadoop的一个工具,基于hadoop去实现的。

处理文件数据可以使用java、python可以对文件式数据进行处理。

Sql对结构化的表去做处理,无法对.txt文件进行处理。

对表结果,相当于把加减乘除给封装了。

Hive有两个功能一.将我们的文件转化为表结构

二.把sql转化为mr代码

元数据  

比如现在有一个文件,鼠标右键属性,属性里面有很多信息,

核心信息,文件位置,大小,所有权,描述数据的称为元数据

一个元数据  hadoop源数据 Namenode(管理命名空间节点)管理 记录块储存位置

一个元数据  hive源数据 把文件转化为表结构 转化为几行,用什么划分

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值