记录hadoop学习到运用实战的整个攻略以及学习的知识点顺序
1.虚拟机
hadoop的环境是Linux,所以我们还需要安装Linux系统。hadoop,有单机安装,伪分布安装和分布安装。对单机模式大家可以不用去关心和学习,因为hadoop的单机模式就失去了它分布式的优势,也就没有意义了。在学习中建议搭建伪分布式,完全分布式是生产环境中使用,当大家把伪分布式学习后,必须对完全分布式有所了解,知道是如何工作的,也可以试着搭建hadoop的完成分布式。因为我们的习惯是使用windows,专门买几台机子机子来练习hadoop成本比较高。
虚拟机的存在就能帮助我们解决这样的问题。 只要内存支持,一台机子上可以多装几台虚拟机,也能实现完全分布式。