Hadoop in Practice 项目教程

庞队千Virginia

于 2024-09-28 07:19:40 发布

阅读量716

点赞数 15

本文链接：https://blog.csdn.net/gitblog_00290/article/details/142606829

版权

Hadoop in Practice 项目教程

hadoop-book Source code to accompany the book "Hadoop in Practice", published by Manning. 项目地址: https://gitcode.com/gh_mirrors/had/hadoop-book

1、项目介绍

Hadoop in Practice 是一个开源项目，旨在提供与 Manning 出版的同名书籍《Hadoop in Practice》相关的源代码、脚本和数据文件。该项目由 Alex Holmes 创建，并托管在 GitHub 上。通过这个项目，开发者可以学习和实践 Hadoop 相关的技术，包括 MapReduce、Pig 等。

2、项目快速启动

2.1 克隆项目

首先，你需要从 GitHub 上克隆项目到本地：

git clone https://github.com/alexholmes/hadoop-book.git

2.2 构建项目

进入项目目录并使用 Maven 进行构建：

cd hadoop-book
mvn package

2.3 运行示例

在运行示例之前，确保你已经配置好了 Hadoop 环境。以下是一个简单的运行示例：

# 将输入文件复制到 HDFS
hadoop fs -mkdir /tmp
hadoop fs -put test-data/ch1/* /tmp/

# 设置 Hadoop 安装路径（如果使用 CDH3，则不需要此步骤）
export HADOOP_HOME=/usr/local/hadoop

# 运行 MapReduce 作业
bin/run.sh com.manning.hip.ch1.InvertedIndexMapReduce /tmp/file1.txt /tmp/file2.txt output