2018年02月_小萌猿

12月 11月 10月 09月 08月 06月 05月 04月 03月 02月 01月

原创 MapReduce的Shuffle过程

总的来说，Shuffle是Mapper和Reducer的中间步骤，它的功能是，将Mapper输出的键值对按照key值重新进行切分和组合，并将key值满足一定条件的键值对传送给特定的Reducer去处理。可以简化Reducer的工作。 Shuffle分为Map端和Reduce端两部分一、Map端，如下图： input：输入数据来源于block，当然map作业直接读取的是split p...

2018-02-26 20:27:50 2210

原创 Linux的RPM安装方式为什么不需要配置环境

Linux的几种软件安装方式：源码编译、压缩包、RPM包，最简单的当然是RPM安装方式，不需配置环境，不需安装相关依赖（依赖自动安装），一直好奇为什么这种方式不需要配置环境。通过RPM方式安装时，是严格遵照Linux对环境变量的路径的要求，比如： /usr/bin 可执行的命令安装目录 /usr/lib 程序所使用的库函数保存位置 /usr/share/doc 基本的软件使用手...

2018-02-16 23:22:34 5739 4

原创 HDFS1.X的单点故障和内存受限问题

HDFS2.X提出的HA和Federation分别对应解决两个问题 –解决单点故障 HDFS HA：通过主备NameNode解决，当主NameNode出现故障时，快速切换到备NameNode上。 –解决内存受限 HDFS Federation（联邦），多个NameNode水平扩展，每一个分管一部分目录，所有的NameNode共享所有DataNode存储资源。一、先说内存受限问题，...

2018-02-14 20:28:12 2526

原创 NameNode、SecondaryNameNode、DataNode

一、NameNode(NN) 主要功能：接受客户端的读写请求并分发给DataNode，DataNode是文件的主要存储与处理的地方。而NameNode中会保存文件的元数据（metadate），包括： 1、文件的拥有者、权限、文件名等 2、文件包含的块（block） 3、这些block保存在哪个DataNode中（DataNode启动时上报）这个metadata信息在磁盘中存储为文件“f

2018-02-06 23:15:45 3218

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人