1 Hadoop RPC概述
1.1 基本概念
是什么:
RPC:Remote Procedure CallProtocol,远程过程调用协议。
有什么用:
允许本地程序像调用本地方法一样调用远程机器上应用程序提供的服务。
为什么引入:
Hadoop作为分布式存储系统,各个节点之间的通信和交互是必不可少的,所以需要实现一套节点间的通信交互机制。
Hadoop中通信接口一共有两类:一类就是本文档中要介绍的RPC接口;另一类是基于TCP或者HTTP实现的流式接口,比如客户端与数据节点以及数据节点与数据节点之间的数据块传输是基于TCP流式接口实现的,Standby Namenode将合并的fsimage回传给Active Namenode是基于HTTP流式接口实现的。
Hadoop中RPC特性: