hadoop3.0.3安装（win10伪环境版）

最新推荐文章于 2023-05-01 12:15:00 发布

leveretz

最新推荐文章于 2023-05-01 12:15:00 发布

阅读量527

点赞数

分类专栏： hadoop 文章标签： hadoop

本文链接：https://blog.csdn.net/leveretz/article/details/113846188

版权

hadoop 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

说明：

Hadoop3在windows下能用的版本是hadoop-3.0.3。

其他版本都会报如下错误：

java.lang.UnsupportedOperationException

at java.nio.file.Files.setPosixFilePermissions(Files.java:2044)

建议在windows下使用hadoop-3.0.3版本

下载

hadoop-3.0.3.tar.gz

winutils-master.zip（https://github.com/cdarlint/winutils）

解压

D:\servers\hadoop-3.0.3

环境配置

HADOOP_HOME=D:\servers\hadoop-3.0.3

PATH增加D:\servers\hadoop-3.0.3\bin

Hadoop配置

hadoop-env.cmd（java路径不能有空格，否则报错）

set JAVA_HOME=C:\jdk1.8.0_271

core-site.xml

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/D:/servers/hadoop-3.0.3/data/tmp</value>

</property>

mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

创建目录

D:\servers\hadoop-3.0.3\data\namenode

D:\servers\hadoop-3.0.3\data\datanode

hdfs-site.xml

<name>dfs.replication</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

<name>dfs.namenode.name.dir</name>

<value>/D:/servers/hadoop-3.0.3/data/namenode</value>

</property>

<name>fs.checkpoint.dir</name>

<value>/D:/servers/hadoop-3.0.3/data/snn</value>

</property>

<name>fs.checkpoint.edits.dir</name>

<value>/D:/servers/hadoop-3.0.3/data/snn</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>/D:/servers/hadoop-3.0.3/data/datanode</value>

</property>

yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.log-aggregation-enable</name>

</property>

替换

解压winutils-master.zip

用hadoop-3.0.0\bin下的文件替换D:\servers\hadoop-3.0.3\bin下的文件

格式化

进入bin目录

hdfs namenode -format

启动

进入sbin目录

start-all

开发环境建议启动：

mapred historyserver

验证

jps

看到namenode、datanode、resourcemanager、nodemanager，OK

访问：http://localhost:8088

访问：http://localhost:9870（以前是50070）

如果碰到job一直卡到资源申请那里可以使用,查看application id

yarn application -list

然后kill掉

yarn application -kill application_1582478379420_0006

备注：

报错：（hadoop3.0.3）

java.lang.NoClassDefFoundError: org/apache/hadoop/yarn/server/timelineservice/collector/TimelineCollectorManager

将share\hadoop\yarn\timelineservice\hadoop-yarn-server-timelineservice-3.0.3.jar 放到share\hadoop\yarn\lib 下

Hadoop3 intellij idea 插件安装

下载intellij idea 2018版（2020版不能用于编译该插件，因为该插件太老了）

https://download.jetbrains.8686c.com/idea/ideaIU-2018.3.6.exe?_ga=2.88489119.549871750.1586744220-1301379995.1579540498

下载

https://github.com/fangyuzhong2016/HadoopIntellijPlugin

HadoopIntellijPlugin-master.zip

解压

D:\hadoop spark\HadoopIntellijPlugin-master

Intellij idea导入

File -> New -> Project from Existing Sources…

Import project from external model

修改pom

<hadoop.2.version>3.0.3</hadoop.2.version>

<IntellijIde.dir>C:\ideaIU-2020.2.3.win</IntellijIde.dir>

编译

进入 terminal

mvn clean

mvn assembly:assembly

生成插件包 HadoopIntellijPlugin-1.0.zip

导入插件

Setting -> Plugins -> install plugin from disk… -> restart

左侧边栏看到Hadoop小象

使用

点击左侧边栏小象，点击+，点击+，新建hadoop连接

OK!!!

mapred开发

新建mvn项目

定义pom文件

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.xzrj.demo.hd</groupId>
    <artifactId>hddemo</artifactId>
    <version>1.0-SNAPSHOT</version>

    <properties>
        <hadoop-common.version>3.0.3</hadoop-common.version>
        <hadoop-hdfs.version>3.0.3</hadoop-hdfs.version>
        <hadoop-client.version>3.0.3</hadoop-client.version>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>${hadoop-common.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>${hadoop-hdfs.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>${hadoop-client.version}</version>
        </dependency>

        <dependency>
            <groupId>log4j</groupId>
            <artifactId>log4j</artifactId>
            <version>1.2.17</version>
        </dependency>

    </dependencies>

    <build>
        <plugins>
        </plugins>
    </build>

</project>

配置log4j

新建log4j.properties

log4j.rootLogger=INFO, A1
log4j.appender.A1=org.apache.log4j.ConsoleAppender
log4j.appender.A1.layout=org.apache.log4j.PatternLayout
log4j.appender.A1.layout.ConversionPattern=%-4r [%t] %-5p %c %x - %m%n

log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=logs/hddemo.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

编写代码

package com.xzrj.demo.hd;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.log4j.LogManager;

import org.apache.log4j.Logger;

import java.io.IOException;

import java.net.URI;

public class WordCount {

private static final Logger lg = LogManager.getLogger(WordCount.class);

// 设置参数

private static String defaultfs = "hdfs://localhost:9000";

private static String hadoopuser = "admin";

private static String inpath = "/in/wordcount.txt";

private static String outpath = "/out/";

private static String jobname = "wordcount";

private static Class<? extends Mapper> mapperclass = WcMapper.class;

private static Class<? extends Reducer> reducerclass = WcReducer.class;

private static Class<?> jarclass = WordCount.class;

public static void main(String[] args) throws Exception{

Configuration conf = new Configuration();

conf.set("dfs.permissions","false");

conf.set("fs.defaultFS",defaultfs);

conf.set("dfs.client.use.datanode.hostname", "true");

System.setProperty("HADOOP_USER_NAME",hadoopuser);

Job job = Job.getInstance(conf, jobname);

job.setMapperClass(mapperclass);

job.setReducerClass(reducerclass);

job.setJarByClass(jarclass);

job.setMapOutputKeyClass(Text.class);

job.setMapOutputValueClass(IntWritable.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);

FileSystem fs = FileSystem.get(new URI(defaultfs), conf, hadoopuser);

Path op = new Path(outpath);

if(fs.exists(op))

fs.delete(op,true);

FileInputFormat.setInputPaths(job, new Path(inpath));

FileOutputFormat.setOutputPath(job, new Path(outpath));

boolean res = job.waitForCompletion(true);

if(!res){

lg.error(jobname + " 失败了!");

}

lg.info(jobname + " 成功了!");

}

private static class WcMapper extends Mapper<LongWritable, Text, Text, IntWritable> {

@Override

protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

String line = value.toString();

String[] words = line.split(" ");

for(String word: words){

context.write(new Text(word), new IntWritable(1));

}

private static class WcReducer extends Reducer<Text, IntWritable, Text, IntWritable> {

@Override

protected void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {

Integer count = 0;

for(IntWritable value: values){

count += value.get();

}

context.write(key, new IntWritable(count));

}

leveretz

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop3.0.3安装（win10伪环境版）

说明：Hadoop3在windows下能用的版本是hadoop-3.0.3。其他版本都会报如下错误：java.lang.UnsupportedOperationException at java.nio.file.Files.setPosixFilePermissions(Files.java:2044)建议在windows下使用hadoop-3.0.3版本下载hadoop-3.0.3.tar.gzwinutils-master.zip（https:...
复制链接

扫一扫

专栏目录