大数据之Hadoop
jQueryZK
本科在校软件专业学生,正在奔向程序员的道路上
展开
-
大数据之Hadoop(六)-hadoop的API和I/O流操作
1、hadoop的API操作1.1建立Maven工程工程目录结构:1.2导入依赖<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 h原创 2020-11-01 10:08:38 · 411 阅读 · 0 评论 -
大数据之Hadoop(五)-Hadoop运行模式之完全分布式运行模式(集群分发脚本、集群配置、SSH无密配置、群起集群、集群时间同步)
1、虚拟机准备通过VMware虚拟机克隆功能将hadoop101克隆出hadoop102,hadoop103,hadoop104三台虚拟机并且这3台虚拟机已经完成(关闭防火墙、配置静态IP、配置主机名称、配置主机映射)的操作,接下来准备用这3台克隆的虚拟机搭建集群。上述操作在这篇博客中有详解:Linux学习(六)-Linux学习过程中实用操作(找回root密码&&克隆虚拟机)2、集群分发因为hadoop102,hadoop103,hadoop104是通过hadoop101克隆出来的,原创 2020-10-06 15:44:01 · 1393 阅读 · 0 评论 -
大数据之Hadoop(四)-Hadoop运行模式之伪分布式运行模式(启动HDFS和YARN并运行MapReduce程序、配置历史服务器和日志聚集)
启动HDFS并运行MapReduce程序1、配置集群1.1配置:hadoop-env.sh先从Linux系统中获取11JDK的安装路径修改hadoop-env.sh配置文件中JAVA_HOME路径:保存后退出1.2配置:core-site.xml[zhukun@hadoop101 hadoop]$ vim core-site.xml1.3配置:hdfs-site.xml[zhukun@hadoop101 hadoop]$ vim core-site.xml2、启动集群2.原创 2020-10-05 15:08:18 · 1992 阅读 · 1 评论 -
大数据之Hadoop(三)-Hadoop运行模式之本地运行模式(实现官方Grep案例和WordCount案例)
Hadoop本地运行模式1、官方Grep案例创建在hadoop-2.7.2文件下面创建一个input文件夹[zhukun@hadoop101 hadoop-2.7.2]$ mkdir input将Hadoop的xml配置文件复制到input[zhukun@hadoop101 hadoop-2.7.2]$ cp etc/hadoop/*.xml input执行share目录下的MapReduce程序[zhukun@hadoop101 hadoop-2.7.2]$ bin/had原创 2020-10-04 16:11:38 · 2046 阅读 · 0 评论 -
大数据之Hadoop(二)-Hadoop运行环境搭建(JDK安装和Hadoop安装及Hadoop目录结构分析--手把手教)
1、虚拟机环境准备1、准备一台虚拟机2、配置网络设置静态IP具体参考:Linux网络配置3、修改主机名vim /etc/sysconfig/network4、关闭防火墙#1:查看防火状态systemctl status firewalldservice iptables status#2:暂时关闭防火墙systemctl stop firewalldservice iptables stop#3:永久关闭防火墙systemctl disable firewalld原创 2020-10-04 15:32:50 · 2465 阅读 · 0 评论 -
大数据之Hadoop(一)-Hadoop入门
1、Hadoop是什么Hadoop是一个由Apache基金会所开发的分布式系统基础架构主要解决,海量数据的存储和海量数据的分析计算问题广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈原创 2020-10-04 14:10:21 · 1547 阅读 · 0 评论