事后诸葛亮的程序人生（微信：zq9017197）

不积跬步无以至千里，不积小流无以成江海，程序人生的精彩需要坚持不懈地积累！

12月 11月

原创十、MapReduce实战篇-端表合并

多表连接订单表 order.txt订单id、商品id、数量1001 01 11002 02 21003 03 31001 02 21002 03 31003 03 5商品表 produce.txt商品id、商品名称01 小米02 华为03 格力将商品表中数据根据商品id合并到订单数据表中。最终数据形式：订单id、商品id、数量、商品名称1001 01...

2018-12-31 01:56:15 299

原创九、MapReduce实战篇-最贵商品

测试数据Order_0000001 Pdt_01 222.8Order_0000002 Pdt_05 722.4Order_0000001 Pdt_05 25.8Order_0000003 Pdt_01 333.8Order_0000003 Pdt_01 33.8Order_0000002 Pdt_03 522.8Order_0000002 Pdt_04 122.4需求分析需...

2018-12-31 01:55:31 430

原创八、MapReduce实战篇-流量汇总

流量汇总需求：统计每一个用户（手机号）所耗费的总上行流量、下行流量，总流量1.在mapper和reducer之间传递多个value值序列化：自己实现了Writable接口（FlowSumBean），在mapper和reducer之间传递一个Bean对象。也可以拼接字符串的方式来实现写出多个值。2.将统计结果按照手机归属地不同省份输出到不同文件中分区：自己实现了Partitioner分...

2018-12-31 01:54:36 461

原创七、MapReduce实战篇-单词计数

环境准备开发MapReduce程序，需要Java环境，通常也就是在eclipse中新建一个Java Project工程jar包准备1）解压hadoop-2.7.2.tar.gz到非中文目录2）进入share\hadoop文件夹，查找所有jar包，并把jar包拷贝到_lib文件夹下3）在全部jar包中查找.source.jar，并剪切到_source文件夹。4）在全部jar包中查找...

2018-12-31 01:53:22 1471

原创六、HDFS其他功能

集群间数据拷贝采用discp命令实现两个hadoop集群之间的递归数据复制hadoop distcp hdfs://cmaster0:8020/user/hadoop/hello.txt hdfs://hadoop102:9000/user/hadoop/hello.txtHadoop存档每个文件均按块存储，每个块的元数据存储在namenode的内存中，因此hadoop存储小文件会非...

2018-12-27 19:41:43 218

原创五、DataNode工作机制

DataNode工作机制1）一个数据块在datanode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据包括数据块的长度，块数据的校验和，以及时间戳。2）DataNode启动后向namenode注册，通过后，周期性（1小时）的向namenode上报所有的块信息。3）心跳是每3秒一次，心跳返回结果带有namenode给该datanode的命令如复制块数据到另一台机器，或...

2018-12-27 19:41:03 246

原创四、服役新数据节点 & 退役旧数据节点

环境准备随着公司业务的增长，数据量越来越大，原有的数据节点的容量已经不能满足存储数据的需求，需要在原有集群基础上动态添加新的数据节点。（1）克隆一台虚拟机（克隆cslave1为cslave2）（2）修改ip地址和主机名称（hostname:cslave2;ip:192.168.1.104）需要修改的地方：vi /etc/udev/rules.d/70-persistent-net.r...

2018-12-26 22:03:41 308

原创三、NameNode工作机制

NameNode &amp; Secondary NameNode工作机制第一阶段：namenode启动（1）第一次启动namenode格式化后，创建fsimage和edits文件。如果不是第一次启动，直接加载编辑日志和镜像文件到内存。（2）客户端对元数据进行增删改的请求。（3）namenode 先记录操作日志，更新滚动日志。（4）namenode 后在内存中对数据进行增删改查。...

2018-12-26 22:01:14 451

原创二、HDFS文件系统

HDFS文件系统的组成NameNode 负责管理整个文件系统的元数据，以及每一个路径（文件）所对应的数据块信息。DataNode 负责管理用户的文件数据块，每一个数据块都可以在多个datanode上存储多个副本。Secondary NameNode 用来监控HDFS状态的辅助后台程序，每隔一段时间获取HDFS元数据的快照。HDFS写数据流程1）客户端向namenode请求上传文件...

2018-12-26 21:59:56 451 1

原创一、Hadoop2.x完全分布式集群搭建

实验环境规划192.168.1.101 cmaster0192.168.1.102 cslave0192.168.1.103 cslave1三台服务器都是安装的CentOS6.8操作系统配置/etc/hosts[root@cmaster0 ~]# vi /etc/hosts192.168.1.101 cmaster0192.168.1.102 cslave0192.16...

2018-12-26 21:57:11 218

《Oracle Wait Interface性能诊断与调整实践指南》

2012-12-17

《ORACLE SQL 高级编程》随书脚本

《ORACLE SQL 高级编程》随书脚本英文版叫《pro oracle sql》想要精通oracle sql必读书籍！

2012-12-17

ORACLE SQL 高级编程

《pro oralce sql》经典书籍的中文版《ORACLE SQL 高级编程》！找了好久才找到的书籍，是中文的，英文瞥的童鞋也可以看的！

2012-12-17

oracle常用函数大全

oracle常用函数大全包含了oracle常用的100多个函数

2011-02-13

1.集合操作 2.EXISTS和NOT EXISTS的使用 3.WITH子句 4.MERGE INTO合并资料 5.层次查询(HIERARICAL RETRIVAL) 6.DECODE函数和行列互换 7.CASE表达式 8.ROWNUM—TOP-N分析 9.相关子查询和非相关子查询 10.增强的GROUP BY 11.分析函数(ANALYTICAL FUNCTIONS) 12.ROWID的使用 13. ORACLE10G正则表达式 14.使用HINT 15.PARITION分区 16.并行操作 17.扩展DDL和DML语句 18.MODEL语句 19.10G闪回查询 20.专题—行列转换 21.专题—连续值和累计值问题 22.专题—NULL和DUAL详 23.专题—时间、数字、字符格式详解 24.专题—ORACLE字符集问题 25.专题-随机值查询

2011-02-13

事后诸葛亮的程序人生（微信：zq9017197）

原创十、MapReduce实战篇-端表合并

原创九、MapReduce实战篇-最贵商品

原创八、MapReduce实战篇-流量汇总

原创七、MapReduce实战篇-单词计数

原创六、HDFS其他功能

原创五、DataNode工作机制

原创四、服役新数据节点 & 退役旧数据节点

原创三、NameNode工作机制

原创二、HDFS文件系统

原创一、Hadoop2.x完全分布式集群搭建

《Oracle Wait Interface性能诊断与调整实践指南》

《ORACLE SQL 高级编程》随书脚本

ORACLE SQL 高级编程

java面试宝典

Linux Shell脚本攻略（pdf书+源码）

oracle常用函数大全

oracle高级sql学习

推荐个hadoop方面的考试认证机构