2019年02月_偶尔想起你

11月 10月 09月 02月

原创详解HDFS的Mapper类和Reduce类及4个泛型参数含义

Mapper类:Mapper组件开发方式：自定义一个类，继承MapperMapper组件的作用是定义每一个MapTask具体要怎么处理数据。例如一个文件，256MB，会生成2个MapTask。即2个MapTask处理逻辑是一样的，只是每个MapTask处理的数据不一样。下面是Mapper类中的4个泛型含义:泛型一:KEYIN：LongWritable，对应的Mapper的输入...

2019-02-14 09:53:09 5495 2

原创 HDFS的MapReduce执行流程

1. 从HDFS中获取数据2. MapReduce首先会将输入的数据进行逻辑切片，每一个切片是一个InputSplit对象3. 每一个InputSplit对象会交给一个MapTask来执行4. 切片中的每一行数据都会触发一次map方法，5. map方法的输入的键默认为数据偏移量，输入的值为这一行的数据；输出的键以及值的类型根据业务确定6. 在Barrier阶段，会将所有相同的键所对应的值...

2019-02-14 09:42:52 280

原创详解大数据HDFS分布式文件系统的写入流程

删除流程:1.客户端发起RPC请求到NameNode2.NameNode收到请求后,将这个操作更新到edits文件以及内存中3.NameNode更新完内存中的元数据之后,会给客户端返回一个ack信号,表示已经删除成功,但此时这个文件并没有真正的从DataNode上删除.4.等到DataNode发送心跳信息给NameNode的时候,NameNode收到心跳信息后.NameNode发现Data...

2019-02-14 09:33:31 216

原创详解大数据HDFS分布式文件系统的写入流程

写入流程:1.客户端发起RPC请求访问NameNode2.NameNode在收到请求之后会进行校验:路径校验,权限校验3.如果所有校验都通过,则计算文件大小,计算切块数量,分配对应的DataNode,记录元数据,将文件块的储存地址,放入到队列中返回给客户端4.客户端收到队列后,将文件进行切块,然后将每一块封装成一个packets对象,准备发送5.客户端取出第一块的地址,从这些地址中选一个...

2019-02-14 09:26:45 304

原创详解大数据HDFS分布式文件系统的读取流程

读取流程:1,客户端通过RPC请求访问NameNode(请求读取)2,NameNode查询请求的文件的元数据,获取到文件的储存路径,然后将文件所对应的全部或者部分文件块的储存地址放入一个队列中,返回给客户端.3,客户端收到队列之后,依次遍历队列,读取文件块.4,客户端从队列中获取到第一个文件块的储存地址,从中选出一个最近的DataNode来进行读取.5.读取完成之后校验文件块的大小是否符...

2019-02-14 09:11:14 565

CRC16循环冗余算法

CRC16循环冗余算法,高位在前和低位在后都有; 对特定字符串进行转换成16进制字符串,然后将字符串进行CRC16校验,得到校验码. 次工具类已经经过本人亲自验证,完全符合标准,目前项目中用到的就是这个工具类.

2020-06-01

Java中文文档以及Java面试宝典

官方的Java开发文档,超详细.可以很好的方便我们平时查看Api,内含有一份Java面试宝典,超详细,无论是你是正在开发程序还是正在找工作,我想你一定用得到.

2020-04-15

该Java工具类调用时只需要类名.方法即可调用。 1.返回纯数字的年月日时分秒时间戳:20191008103656 4.在日期上增加数个整月 5.在日期上增加天数 6.在日期上增加n分钟 7.两个时间相差距离多少天多少小时多少分多少秒 8.按默认格式的字符串距离今天的天数 9.比较两个时间的大小 HH:mm:ss 10.按用户格式字符串距离今天的天数 11.cron "0 06 10 15 1 ? 2014" 专门用于处理springboard定时任务修改cron参数的日期处理方法 12.获取本月第一天(月初时间) 13.获取本月最后一天(月底时间) 以上这些方法都在该Java工具类，当然不仅仅包含这些，还有其他的很多。

2019-11-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_43181007的博客

原创详解HDFS的Mapper类和Reduce类及4个泛型参数含义

原创 HDFS的MapReduce执行流程

原创详解大数据HDFS分布式文件系统的写入流程

原创详解大数据HDFS分布式文件系统的写入流程

原创详解大数据HDFS分布式文件系统的读取流程

CRC16循环冗余算法

Java中文文档以及Java面试宝典

最全Java常用日期处理工具类

hadoop.zip

Java基础面试题

Tes视频上传三步走

豆瓣电影爬虫案例

空空如也

原创 详解HDFS的Mapper类和Reduce类及4个泛型参数含义

原创 HDFS的MapReduce执行流程

原创 详解大数据HDFS分布式文件系统的写入流程

原创 详解大数据HDFS分布式文件系统的写入流程

原创 详解大数据HDFS分布式文件系统的读取流程

CRC16循环冗余算法

Java中文文档以及Java面试宝典

最全Java常用日期处理工具类

hadoop.zip

Java基础面试题

Tes视频上传三步走

豆瓣电影爬虫案例

空空如也

原创详解HDFS的Mapper类和Reduce类及4个泛型参数含义

原创详解大数据HDFS分布式文件系统的写入流程

原创详解大数据HDFS分布式文件系统的写入流程

原创详解大数据HDFS分布式文件系统的读取流程