hadoop HDFS2

HDFS读写流程
HDFS client调用FileSystem.open(filePath),
与NN进行[RPC]通信,返回该文件的block列表,返回FSDataInputStream

HDFS client调用FileSystem.read方法
与第一个块最近的DN进行读取,读取完成后,检查是否OK?
如果ok,就会关闭与DN通信
如果不ok,就会从第二个节点去读取,以此类推
当block列表全部完成后,HDFS client调用FSDataInputStream的close方法,关闭数据流

HDFS写流程
HDFS client 调用 Filesystem.create (filePath)方法与NN进行【RPC】通信
NN会检香这个文件是否存在?是否有权限创建这个文件
如果都可以,就创建个文件这个时候,文件是没有数据的,也不关联block
NN会再根据文件的大小,块大小,副木数等计算要上传多少的块和对应的D节点,最终这个信息返回给客户端 【FSDataoutputstream】对象
HDFS client调用客户端【FSDataoutputstream 】的write方法,根据N返回的信息,将第一个块的第一个副木写到DN1,写完复制到DN2,再复制到DN3。
当我们三个副木写完,DN3返回ack【确认字符】DN2
52 DN2接收到ack,返送ack给 DN1DN1接受到ack,返回ack给到 【FSDataoutputstream 】,告诉它第一个块的三副本写完了
以此类推

当所有的块全部都写完
HDES client调用 【ESDataoutputstream】的close方法
关闭数据流
然后调用Filesystem.complete方法,告诉w文件写成功。

HDFS文件读写流程

在正式介绍HDFS小文件存储方案之前,我们先介绍一下当前HDFS上文件存取的基本流程。

*(1) 读文件流程
1)client端发送读文件请求给namenode,如果文件不存在,返回错误信息,否则,将该文件对应的block及其所在datanode位置发送给client
2) client收到文件位置信息后,与不同datanode建立socket连接并行获取数据。
在这里插入图片描述

(2) 写文件流程
1) client端发送写文件请求,namenode检查文件是否存在,如果已存在,直接返回错误信息,否则,发送给client一些可用datanode节点
2) client将文件分块,并行存储到不同节点上datanode上,发送完成后,client同时发送信息给namenode和datanode
3) namenode收到的client信息后,发送确信信息给datanode
4) datanode同时收到namenode和datanode的确认信息后,提交写操作。*
在这里插入图片描述

sql
1.求往后第四个数
select
lead(sal,4) over(partition by deptno order by hiredate)
from emp
2.求当前行和以下五 行
select
sum(sal) over (partition by deptno order by hiredate rows between current row and 4 following)
3.求每个spu当前和之后的和
select
spu_id,
pt,
click_pv,
sum(click_pv) over(partition by spu_id order by pt ) as x,
sum(click_pv) over(partition by spu_id order by pt rows between unbounded preceding and 2 following) as y --当前行和之前行
from click

4.连续登录
select id,max© from(select id,sum(b)+1 as c from (select
id,
login_date,
lead(login_date,1) over(partition by id order by login_date)-login_date as b
from login)
where b=1
group by id
)
group by id

每年第一天
select id,date_sub,count(1) from
(select
id,
login_date,
row_number() over(partition by id order by login_date) as rn,
dayodyear(login_date)-row_number() over(partition by id order by login_date) as date_sub
from login
) as a
group by id,date_sub

做差
select id,date_sub,count(1) from
(select
id,
login_date,
row_number() over(partition by id order by login_date) as rn,
date_sub(login_date,interval row_number() over()partition bu id order by login_date)day)as date_sub
login_date) as date_sub
from login
) as a
group by id,date_sub

对应开始结束日期
max(date_date) min(date_date) group by id

5.emp表递归

select t.empno, t.ename, t.mgr, level
from emp t
start with t.empno =‘7839’
connect by prior t.empno = t.MGR
order by level

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值