![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hadoop
文章平均质量分 79
Tracker_wjw
。S a y : 正 在 学 大 数 据 的 菜 鸟 儿.....
展开
-
Hadoop学习(一) — 初识Hadoop
一、Hadoop是什么从狭义上讲:。。。 从广义上讲:。。。 说白了 The Apache™ Hadoop® project develops open-source software for reliable, scalable, distributed computing. Hadoop是做可靠的、可扩展的、分布式计算,说白了就是处理海量数据问题的解决方案。二、Hadoop要解决原创 2016-04-07 21:05:56 · 635 阅读 · 0 评论 -
Hadoop学习(二) — Hadoop2.4伪分布式的安装与测试
一、Linux环境装备 1.安装jdk1.7以上版本 2.修改主机名 [hadoop123@tracker-wjw ~]$ vi /etc/sysconfig/network NETWORKING=yes HOSTNAME=tracker-wjw 3.修改主机名和IP的映射关系,注意hadoop的安装中主机名不要有"_" [hadoop123@tracker-wjw ~]$ vi /et原创 2016-04-10 14:13:01 · 532 阅读 · 0 评论 -
Hadoop学习(三)— hdfs : NameNode与DataNode的实现机制
一、NameNode的工作机制 二、DataNode的工作机制 三、HDFS在Java客户端编写原创 2016-04-25 20:49:16 · 3702 阅读 · 0 评论 -
Hadoop学习(四)— MapReduce入门
MapReduce是由Google提出的一种分布式计算模型,主要用于搜索领域,解决海量数据的计算问题。它实现了把简单的运算逻辑扩展到海量数据的场景中,进行分布式运行,对于普通程序员来说只需要编写业务逻辑来实现海量数据的处理,而不需要过多的去关注分布式实现细节。 mapreduce分为map阶段与reduce阶段,开发者只需要实现map()和reduce()两个函数,即可实现分布式计算。原创 2016-05-09 20:32:39 · 576 阅读 · 0 评论