python写的hadoop实战_Hadoop实战

最新推荐文章于 2024-05-15 07:18:00 发布

weixin_39999586

最新推荐文章于 2024-05-15 07:18:00 发布

阅读量316

点赞数

文章标签： python写的hadoop实战

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39999586/article/details/111529345

版权

Hadoop实战

1 Hadoop简介

1.1 什么是Hadoop

1.1.1 Hadoop概述

1.1.2 Hadoop的历史

1.1.3 Hadoop的功能与作用

1.1.4 Hadoop的优势

1.1.5 Hadoop的应用现状和发展趋势

1.2 Hadoop项目及其结构

1.3 Hadoop的体系结构

1.3.1 HDFS的体系结构

1.3.2 MapReduce的体系结构

1.4 Hadoop与分布式开发

1.5 Hadoop计算模型—MapReduce

1.6 Hadoop的数据管理

1.6.1 HDFS的数据管理

1.6.2 HBase的数据管理

1.6.3 Hive的数据管理

1.7 小结

2 Hadoop的安装与配置

2.1 在Linux上安装与配置Hadoop

2.1.1 安装JDK 1.6

2.1.2 配置SSH免密码登录

2.1.3 安装并运行Hadoop

2.2 在Windows上安装与配置Hadoop

2.2.1 安装Cygwin

2.2.2 配置环境变量

2.2.3 安装和启动sshd服务

2.2.4 配置SSH免密码登录

2.3 安装和配置Hadoop集群

2.3.1 网络拓扑

2.3.2 定义集群拓扑

2.3.3 建立和安装Cluster

2.4 日志分析及几个小技巧

2.5 小结

3 Hadoop应用案例分析

3.1 Hadoop在Yahoo！的应用

3.2 Hadoop在eBay的应用

3.3 Hadoop在百度的应用

3.4 Hadoop在Facebook的应用

3.5 Hadoop平台上的海量数据排序

3.6 小结

4 MapReduce计算模型

4.1 为什么要用MapReduce

4.2 MapReduce计算模型

4.2.1 MapReduce Job

4.2.2 Hadoop中的Hello World程序

4.2.3 MapReduce的数据流和控制流

4.3 MapReduce任务的优化

4.4 Hadoop流

4.4.1 Hadoop流的工作原理

4.4.2 Hadoop流的命令

4.4.3 实战案例：添加Bash程序和Python程序到Hadoop流中

4.5 Hadoop Pipes

4.6 小结

5 开发MapReduce应用程序

5.1 系统参数的配置

5.2 配置开发环境

5.3 编写MapReduce程序

5.3.1 Map处理

5.3.2 Reduce处理

5.4 本地测试

5.5 运行MapReduce程序

5.5.1 打包

最低0.47元/天解锁文章

weixin_39999586

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python写的hadoop实战_Hadoop实战

Hadoop实战1 Hadoop简介1.1 什么是Hadoop1.1.1 Hadoop概述1.1.2 Hadoop的历史1.1.3 Hadoop的功能与作用1.1.4 Hadoop的优势1.1.5 Hadoop的应用现状和发展趋势1.2 Hadoop项目及其结构1.3 Hadoop的体系结构1.3.1 HDFS的体系结构1.3.2 MapReduce的体系结构1.4 Hadoop与分布式开发1.5...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。