- 博客(2)
- 资源 (4)
- 收藏
- 关注
原创 9、Hadoop序列化(自定义传输对象)
文章目录1、建立输入数据对应的bean2、建立Mapper分割处理数据3、建立Reducer合并数据4、建立job的启动类5、测试 序列化就是把内存中的对象转化成字节序列,便于网络间传输和持久化到硬盘上,避免数据掉电丢失。 在Haoop中定义的最常用的基本对象,都已经实现了org.apache.hadoop.io.Writable接口,比如BooleanWritable、ByteWritable、...
2019-12-12 00:07:54 430
原创 8、MapReduce实现WordCount单词统计
文章目录一、Mapper阶段二、Reduce阶段三、Driver阶段四、集群测试 MapReduce分布式计算包含两个阶段:Mapper和Reduce。一个完整的MapReduce程序在分布式计算时包括三类实例进程: MrAppMaster:负责整个程序的过程调度及状态协调; MapTask:负责Map阶段整个数据处理流程; ReduceTask:负责Reduce阶段整个数据处理流程。 Map...
2019-12-01 23:26:40 1231
kubeadm-basic.images.tar.gz
2020-06-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人