大数据需要从哪里入手收藏了一份详细的学习路线图

最新推荐文章于 2024-04-27 20:40:11 发布

铁拳虎

最新推荐文章于 2024-04-27 20:40:11 发布

阅读量358

点赞数

分类专栏：大数据学习大数据开发大数据入门数据分析 Hadoop Kafka 大数据大数据技术人工智能 spark Linux 文章标签：大数据大数据学习大数据开发编程语言程序员

本文链接：https://blog.csdn.net/juan189/article/details/89282906

版权

大数据学习同时被 3 个专栏收录

115 篇文章 14 订阅

订阅专栏

大数据入门

115 篇文章 3 订阅

订阅专栏

数据分析

115 篇文章 0 订阅

订阅专栏

对于数据而言，没有大数据技术的数据一无是处，但经过大数据技术处理的数据，就是金矿，价值连城！

面临能将"矿"玩弄于股掌之间的大数据技术，谁能坐怀不乱？谁又能忍心放弃这个难得的机遇呢？那么问题来了，该如何学习大数据技术呢？学习是一项很好的技能，但也需要循序渐进！

学习大数据的头一步：打好基础，比高逼格的大数据技术更重要！而基础知识就是：编程语言和linux操作系统。

我们以java编程为例，当然了你所擅长的编程语言也可以是python、Scala等！

很多初学者，对大数据的概念都是模糊不清的，大数据是什么，能做什么，学的时候，该按照什么线路去学习，学完往哪方面发展，想深入了解，想学习的同学欢迎加入大数据学习qq群：199427210，有大量干货（零基础以及进阶的经典实战）分享给大家，并且有清华大学毕业的资深大数据讲师给大家免费授课，给大家分享目前国内最完整的大数据高端实战实用学习流程体系

Java：只需要学习Java的标准版JavaSE就可以了，像Servlet、JSP、Tomcat、Struts、Spring、Hibernate，Mybatis都是JavaEE方向的技术在大数据技术里用到的并不多，只需要了解就可以了，当然Java怎么连接数据库还是要知道的，像JDBC一定要掌握一下，有同学说Hibernate或Mybites也能连接数据库啊，为什么不学习一下，我这里不是说学这些不好，而是说学这些可能会用你很多时间，工作中也不常用，我还没看到谁做大数据处理用到这两个东西的，当然你的精力很充足的话，可以学学Hibernate或Mybites的原理，不要只学API，这样可以增加你对Java操作数据库的理解，因为这两个技术的核心就是Java的反射加上JDBC的各种使用。

Linux：因为大数据相关软件都是在Linux上运行的，所以Linux要学习的扎实一些，学好Linux对你快速掌握大数据相关技术会有很大的帮助，能让你更好的理解hadoop、hive、hbase、spark等大数据软件的运行环境和网络环境配置，能少踩很多坑，学会shell就能看懂脚本这样能更容易理解和配置大数据集群。还能让你对以后新出的大数据技术学习起来更快。

接下来就是大数据技术的两大生态系统：Hadoop生态系统和spark生态系统。

Hadoop：这是现在流行的大数据处理平台几乎已经成为大数据的代名词，所以这个是必学的。Hadoop里面包括几个组件HDFS、MapReduce和YARN，HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面，MapReduce是对数据进行处理计算的，它有个特点就是不管多大的数据只要给它时间它就能把数据跑完，但是时间可能不是很快所以它叫数据的批处理。YARN是体现Hadoop平台概念的重要组件有了它大数据生态体系的其它软件就能在hadoop上运行了，这样就能更好的利用HDFS大存储的优势和节省更多的资源比如我们就不用再单独建一个spark的集群了，让它直接跑在现有的hadoop yarn上面就可以了。