自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

事后诸葛亮的程序人生(微信:zq9017197)

不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!

  • 博客(10)
  • 资源 (10)
  • 收藏
  • 关注

原创 十、MapReduce实战篇-端表合并

多表连接订单表 order.txt订单id、商品id、数量1001 01 11002 02 21003 03 31001 02 21002 03 31003 03 5商品表 produce.txt商品id、商品名称01 小米02 华为03 格力将商品表中数据根据商品id合并到订单数据表中。最终数据形式:订单id、商品id、数量、商品名称1001 01...

2018-12-31 01:56:15 299

原创 九、MapReduce实战篇-最贵商品

测试数据Order_0000001 Pdt_01 222.8Order_0000002 Pdt_05 722.4Order_0000001 Pdt_05 25.8Order_0000003 Pdt_01 333.8Order_0000003 Pdt_01 33.8Order_0000002 Pdt_03 522.8Order_0000002 Pdt_04 122.4需求分析需...

2018-12-31 01:55:31 430

原创 八、MapReduce实战篇-流量汇总

流量汇总需求:统计每一个用户(手机号)所耗费的总上行流量、下行流量,总流量1.在mapper和reducer之间传递多个value值序列化:自己实现了Writable接口(FlowSumBean),在mapper和reducer之间传递一个Bean对象。也可以拼接字符串的方式来实现写出多个值。2.将统计结果按照手机归属地不同省份输出到不同文件中分区:自己实现了Partitioner分...

2018-12-31 01:54:36 461

原创 七、MapReduce实战篇-单词计数

环境准备开发MapReduce程序,需要Java环境,通常也就是在eclipse中新建一个Java Project工程jar包准备1)解压hadoop-2.7.2.tar.gz到非中文目录2)进入share\hadoop文件夹,查找所有jar包,并把jar包拷贝到_lib文件夹下3)在全部jar包中查找.source.jar,并剪切到_source文件夹。4)在全部jar包中查找...

2018-12-31 01:53:22 1471

原创 六、HDFS其他功能

集群间数据拷贝采用discp命令实现两个hadoop集群之间的递归数据复制hadoop distcp hdfs://cmaster0:8020/user/hadoop/hello.txt hdfs://hadoop102:9000/user/hadoop/hello.txtHadoop存档每个文件均按块存储,每个块的元数据存储在namenode的内存中,因此hadoop存储小文件会非...

2018-12-27 19:41:43 218

原创 五、DataNode工作机制

DataNode工作机制1)一个数据块在datanode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。2)DataNode启动后向namenode注册,通过后,周期性(1小时)的向namenode上报所有的块信息。3)心跳是每3秒一次,心跳返回结果带有namenode给该datanode的命令如复制块数据到另一台机器,或...

2018-12-27 19:41:03 246

原创 四、服役新数据节点 & 退役旧数据节点

环境准备随着公司业务的增长,数据量越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的数据节点。(1)克隆一台虚拟机(克隆cslave1为cslave2)(2)修改ip地址和主机名称(hostname:cslave2;ip:192.168.1.104)需要修改的地方:vi /etc/udev/rules.d/70-persistent-net.r...

2018-12-26 22:03:41 308

原创 三、NameNode工作机制

NameNode & Secondary NameNode工作机制第一阶段:namenode启动(1)第一次启动namenode格式化后,创建fsimage和edits文件。如果不是第一次启动,直接加载编辑日志和镜像文件到内存。(2)客户端对元数据进行增删改的请求。(3)namenode 先记录操作日志,更新滚动日志。(4)namenode 后在内存中对数据进行增删改查。...

2018-12-26 22:01:14 451

原创 二、HDFS文件系统

HDFS文件系统的组成NameNode 负责管理整个文件系统的元数据,以及每一个路径(文件)所对应的数据块信息。DataNode 负责管理用户的文件数据块,每一个数据块都可以在多个datanode上存储多个副本。Secondary NameNode 用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照。HDFS写数据流程1)客户端向namenode请求上传文件...

2018-12-26 21:59:56 451 1

原创 一、Hadoop2.x完全分布式集群搭建

实验环境规划192.168.1.101 cmaster0192.168.1.102 cslave0192.168.1.103 cslave1三台服务器都是安装的CentOS6.8操作系统配置/etc/hosts[root@cmaster0 ~]# vi /etc/hosts192.168.1.101 cmaster0192.168.1.102 cslave0192.16...

2018-12-26 21:57:11 218

《Oracle Wait Interface性能诊断与调整实践指南》

《Oracle Wait Interface性能诊断与调整实践指南》

2012-12-17

《ORACLE SQL 高级编程》随书脚本

《ORACLE SQL 高级编程》随书脚本 英文版叫《pro oracle sql》 想要精通oracle sql必读书籍!

2012-12-17

ORACLE SQL 高级编程

《pro oralce sql》经典书籍的中文版《ORACLE SQL 高级编程》! 找了好久才找到的书籍,是中文的,英文瞥的童鞋也可以看的!

2012-12-17

java面试宝典

java面试宝典,面试的时候必备资料!

2012-12-17

Linux Shell脚本攻略(pdf书+源码)

Linux Shell脚本攻略(pdf书+源码)

2012-12-17

oracle常用函数大全

oracle常用函数大全 包含了oracle常用的100多个函数

2011-02-13

oracle高级sql学习

1.集合操作 2.EXISTS和NOT EXISTS的使用 3.WITH子句 4.MERGE INTO合并资料 5.层次查询(HIERARICAL RETRIVAL) 6.DECODE函数和行列互换 7.CASE表达式 8.ROWNUM—TOP-N分析 9.相关子查询和非相关子查询 10.增强的GROUP BY 11.分析函数(ANALYTICAL FUNCTIONS) 12.ROWID的使用 13. ORACLE10G正则表达式 14.使用HINT 15.PARITION分区 16.并行操作 17.扩展DDL和DML语句 18.MODEL语句 19.10G闪回查询 20.专题—行列转换 21.专题—连续值和累计值问题 22.专题—NULL和DUAL详 23.专题—时间、数字、字符格式详解 24.专题—ORACLE字符集问题 25.专题-随机值查询

2011-02-13

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除