零基础学习hadoop线路指导

5 篇文章 0 订阅
2 篇文章 0 订阅

零基础学习hadoop,没有想象的那么困难,也没有想象的那么容易。
整个过程整理一下,给大家参考,欢迎讨论,共同学习。

从一开始什么都不懂,到能够搭建集群,开发。
整个过程,只要有Linux 基础,虚拟机化和java 基础,其实hadoop,没有太大的困难。

首先整体说一下学习过程(供大家借鉴)

首先查阅了资料,什么是hadoop,至于这方面,你可以参考这个帖子hadoop 新手学习指导
对这个有了整体的认识之后开始下面内容。
我们知道hadoop,有单机安装,伪分布安装和分布安装。
同时hadoop 的环境是Linux,所以我们还需要安装Linux 系统。
因为我们的习惯是使用windows,所以对于Linux 上来就安装软件之类的,困难度很大。
并且我们要搭建集群,需要多台硬件的,不可能为了搭建集群,去买三台电脑。

从成本和使用我们需要懂虚拟化方面的知识。这里的虚拟化其实就是我们需要懂得虚拟机的使用。
因为hadoop 安装在Linux 中,才能真正发挥作用。所以我们也不会使用windows。

基于以上内容。所以我们需要懂得

  • 虚拟化
  • Linux
  • java 基础

下面来详细介绍

1.虚拟化

刚开始学习,上来就安装了虚拟机wmware station,然后创建虚拟机,安装Linux。但是问题来了。
虚拟机的网络难住,因为缺乏这方面的知识,所以不得不停下来,学习虚拟机的网络,该怎么搞?

虚拟机网络分为三种:

  • 1.briage
  • 2.host-only
  • 3.nat

这不是很简单的吗?网上资料也不少。
可是事情并没有想象的那么简单,因为nat 虽然能上网,但是虚拟系统无法和本局域网中的其他真实主机进行通讯。
桥接模式全都需要手工配置,而且这里还需要明白自己是本机拨号上网,还是路由拨号上网。
host-only 创建一个与网内其他机器相隔离的虚拟系统,这个更不行。
这些都不适合我们的hadoop 集群。
hadoop 要求主机与虚拟机与网络,这三者都是通的,在安装的过程中,才不会遇到麻烦。
所以这就是虚拟化方面的困难。

下面总结了在虚拟化方面需要做的:

对于上面你可能了解的还不够,下面咱们论坛会员具体实践指导,可以与他们相互交流:

上面是三种不同网络模式下,如何达到,虚拟机,主机,网络三者互通。

上面的知识具备了我们开始动手:
第一步:下载软件
VMware Workstation 10.0.0 简体中文正式版官方下载地址
第二步:安装和使用
新手指导windows 使用虚拟机安装Linux(ubuntu):包括下载及安装指导

上面的帖子很齐全,包括wmware 下载Linux 桌面版下载。还有安装指导,包括下面需要讲解的Linux 安装指导
VMware workstation 安装linux(ubuntu)配置详解
在这里我们安装完毕虚拟机,安装完毕Linux,我们需要返回第一步,进行网络设置。
但是在网络设置中,我们会遇到各种各样的困难,因为缺乏Linux 知识。
同时这里补充一些虚拟化的基础知识:
虚拟网卡概述
VMware 虚拟机网络设置方法
虚拟机(Linux 操作系统)三种网络模式切换遇到的问题

2.Linux

2.1、Linux 基础知识

对于Linux 的学习也是一个过程,因为可能你连最简单的开机和关机命令都不会,更不要谈配
置网络。这里面给大家提供刚开始学习所查阅的资料和经验总结。
首先我们需要使用一些命令,进行网络配置,但是在网络配置中,这里面又必须懂得虚拟机的
一些知识,所以前面的虚拟机知识需要掌握扎实一些。

对于网络配置:

其实还是上面三个,但是我们会遇到各种不会的命令,即使能查到命令,我们也不能使用。为
什么会这样,因为各种有的命令,是需要使用安装包的。我们在配置网络过程中,同样会遇到
各种各样的奇怪的配置。在我们的Linux 的系统,不能找到文件。这里只举ubuntu。网络配置
文件/etc/network/interfaces。
我们配置完毕之后,有各种网络重启方式:
- /etc/init.d/networking restart
这是一种网络重启方式,但是有时候并不管用。
那么这时候我们遇到困难了,刚接触命令不起作用,该怎么办?
- ifconfig eth0 down / ifconfig eth0 up
(这里同样需要明白,我这里使用的是eth0 上网的,如果你使用的是eth1,就需要替换成eth1)
上面的两个命令能达到同样的效果。
再举一例:
我们需要配置网络文件,在很多网络配置是使用下面的命令的

vim /etc/network/interfaces

但是我们看到下面错误

1. The program vim can be found in the following package:
2. vim
3. vim -gnome
4. vim-tiny
5. vim-gtk
6. vim-nox
7. Try:sudo apt-get install <select package>

这和我们看到的配置完全不一样。这是因为我们安装Linux 之后,并没有安装vim 包。
所以我们又遇到了困难。如果你熟悉Linux 的话,这个根本不是问题。

vi /etc/network/interfaces

上面命令迎刃而解。一个vim,一个vi。
在我们刚接触这些肯定云里雾里,所以你需要首先有成就感,然后在慢慢接触。

下面都是经过实践的内容,也算是经验,大家可以参考。

2.2、Linux 安装hadoop

上面切记浮躁,因为这也是上面一到两个月的总结。
我们不可能一天两天就能完成。
所以上面需要我们经过最起码完全一周的时间。
我们熟悉了Linux 命令,熟悉了网络知识。
后面我们进行的快多了。
部署集群,首先需要安装java,然后安装hadoop。

首先我们还是从零基础开始。

我们需要下载和本地电脑相匹配的jdk,是32 位的下载32 位,是64 位的下载64 位。
这里我们从最简单的入手。
在这过程中,可能遇到问题的是环境变量的配置,造成命令不能识别。
而这里你需要学习新的Linux 知识。
不过如果前面你已经配置完网络,有了这个基础,在学习新的知识,压力明显变小了。

下面给大家分享一下,在Linux 中如何安装Java 和hadoop。

ok,暂时写到这里以后补充…….

原文链接:http://www.aboutyun.com/thread-6780-1-1.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值