hadoop初体验

安装 搭建环境
基本命令
简单分词处理

1.安装搭建
(环境:ubuntu 18.04 LTS)

  • 安装 jdk8

    • sudo apt update #更新软件源的metadata
    • sudo apt install openjdk-8-jdk-headless
    • sudo apt install net-tools openssh-server
  • 配置环境变量

    • gedit ~/.bashrc
    • 在文件末另起一行添加如下内容,并保存export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/
    • 运行命令 source ~/.bashrc 使之生效
  • 下载hadoop

    • cd ~/Downloads
    • wget "https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz"
  • 解压

    • sudo mkdir /usr/local/hadoop
    • sudo tar xzf hadoop-2.7.7.tar.gz -C /usr/local/hadoop
  • 修改权限

    • sudo chmod -R 755 /usr/local/hadoop/hadoop-2.7.7
    • sudo chown -R fosia:fosia /usr/local/hadoop/hadoop-2.7.7

    fosia是我的用户名

  • 查看hadoop版本信息:/usr/local/hadoop/hadoop-2.7.7/bin/hadoop version
    (配置了环境之后我们可以直接运行hadoop version来查看版本信息)

  • 配置一下环境变量,在~/.bashrc文件末加上如下内容并保存

    • export HADOOP_HOME=/usr/local/hadoop/hadoop-2.7.7
    • export PATH=$PATH:$HADOOP_HOME/sbin
    • export PATH=$PATH:$HADOOP_HOME/bin

    运行命令 source ~/.bashrc 使之生效
    这样我们在运行hadoop的时候就不用写/usr/local/hadoop/hadoop-2.7.7/bin这么长的绝对路径

(Hadoop默认的是单机版本,不影响后续的简单操作,分布式版本网上也有搭建教程)

2.基本命令

  • 查看目录
    • 直接运行hdfs dfs -ls是查看根目录
    • 查看特定目录时运行hdfs dfs -ls 路径例如hdfs dfs -ls /test
  • 创建目录
    • hdfs dfs -mkdir 路径
    • 例如hdfs dfs -mkdir /test/test1
  • 目录包含的文件大小
    • hdfs dfs -du 路径
    • 例如hdfs dfs -du /test/test1
  • 查看文件内容
    • hdfs dfs -cat 文件
    • 例如hdfs dfs -cat output
  • 删除
    • 删除目标目录:hdfs dfs -rm
    • 删除目标目录下的所有目录:hdfs dfs -rm -r
  • 把本地文件复制到hdfs的文件
    • hdfs dfs -put 本地文件 hdfs中的文件
    • 例如hdfs dfs -put /Desktop/test.txt input
  • 复制文件到目标文件
    • hdfs dfs -cp output /test/test1
  • 移动文件
    • hdfs dfs -mv /output /test/test1

3.简单的分词处理

  • 下载eclipse
    • 下载:可以在虚拟机内下载也可以下载之后把tar文件拖入虚拟机
    • 添加jar:分别建立用户hadoop_commom,hadoop_hdfs,hadoop_mapreduce并且添加相应的jar
  • 创建java工程WordCount
    • 创建过程中加入我们刚才创建的用户
    • 在src新建类WordCount
    • 粘贴代码下面代码保存
import java.io.IOException;
import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;
import org<
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值