之前说了大数据是什么,现在说一下怎么来学习大数据。
首先Java基础之前已经说了,想学的同学建议可以去看一下。这里就不再介绍和学习Java了。
大数据是解决存储和计算的,所以需要一些存储和计算的框架。学大数据就避免不了学习hadoop生态。
所谓的hadoop生态就是围绕hadoop的一圈框架。包括hadoop,zookeeper,flume,kafka,hive等等。讲到这儿可能因为突然激增的一些专业名词大家有些迷茫了。不用担心。接下来我会用比较通俗的语言来介绍一下,并且会有实际操作来教大家。
大数据在实际中都是需要集群的。集群可以理解为一群电脑,这样一群电脑存的东西是不是就多了,是不是同时去计算一个东西的效率也就会快很多。对,大数据就是这样。大家在之后的学习中是没有集群的,所以可以用到虚拟机。虚拟机就是在咱们电脑上安装一个虚拟机软件,可以把咱们的电脑当成多个小电脑来使用,这样起到虽然性能不会增加,但是可以起到一个练习的作用。接下来会一步一步的把我搭集群的经过全部展示给大家。这样在以后的学习中就可以在集群中练习和学习了。至于理论和概念的东西,笔者不想说太多,毕竟网上一搜就会搜到很多概念性的知识,笔者只是想让大家快速的了解和接触这个东西,从而学习现实中是如何操作的。如果需要了解各个东西的具体概念之类的话,可以自行查询一些相关的内容或者视频看一下就好,其实很多东西来说,你会用就可以了,真的要研究透彻底层原理是怎么实现的话,相对于花费的时间反而会更长一些,当然相对的理解也会更深刻,从而出现一些问题就能自己解决掉。下一篇开始,我想开始说第一个非常重要的东西,也就是完整的干货问题:从0-1搭集群(基于虚拟机的)。