数据中心网络设计方案,数据中心网络规划设计

最新推荐文章于 2024-03-22 20:56:38 发布

小浣熊的技术

最新推荐文章于 2024-03-22 20:56:38 发布

阅读量2.2k

点赞数 2

文章标签：网络 hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ynca67269/article/details/126332190

版权

如何开始学习大数据？

首先我们要了解Java语言和Linux操作系统，这两个是学习大数据的基础，学习的顺序不分前后。

Java：只要了解一些基础即可，做大数据不需要很深的Java技术，学javaSE就相当于有学习大数据基础。

Linux：因为大数据相关软件都是在Linux上运行的，所以Linux要学习的扎实一些，学好Linux对你快速掌握大数据相关技术会有很大的帮助，能让你更好的理解hadoop、hive、hbase、spark等大数据软件的运行环境和网络环境配置，能少踩很多坑，学会shell就能看懂脚本这样能更容易理解和配置大数据集群。

还能让你对以后新出的大数据技术学习起来更快。Hadoop：这是现在流行的大数据处理平台几乎已经成为大数据的代名词，所以这个是必学的。

Hadoop里面包括几个组件HDFS、MapReduce和YARN，HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面，MapReduce是对数据进行处理计算的，它有个特点就是不管多大的数据只要给它时间它就能把数据跑完，但是时间可能不是很快所以它叫数据的批处理。

Zookeeper：这是个万金油，安装Hadoop的HA的时候就会用到它，以后的Hbase也会用到它。

它一般用来存放一些相互协作的信息，这些信息比较小一般不会超过1M，都是使用它的软件对它有依赖，对于我们个人来讲只需要把它安装正确，让它正常的run起来就可以了。

Mysql：我们学习完大数据的处理了，接下来学习学习小数据的处理工具mysql数据库，因为一会装hive的时候要用到，mysql需要掌握到什么层度那?你能在Linux上把它安装好，运行起来，会配置简单的权限，修改root的密码，创建数据库。

这里主要的是学习SQL的语法，因为hive的语法和这个非常相似。Sqoop：这个是用于把Mysql里的数据导入到Hadoop里的。

当然你也可以不用这个，直接把Mysql数据表导出成文件再放到HDFS上也是一样的，当然生产环境中使用要注意Mysql的压力。

Hive：这个东西对于会SQL语法的来说就是神器，它能让你处理大数据变的很简单，不会再费劲的编写MapReduce程序。有的人说Pig那?它和Pig差不多掌握一个就可以了。

Oozie：既然学会Hive了，我相信你一定需要这个东西，它可以帮你管理你的Hive或者MapReduce、Spark脚本，还能检查你的程序是否执行正确，出错了给你发报警并能帮你重试程序，最重要的是还能帮你配置任务的依赖关系。

我相信你一定会喜欢上它的，不然你看着那

最低0.47元/天解锁文章

小浣熊的技术

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
数据中心网络设计方案,数据中心网络规划设计

数据多了同样也需要排队处理，这样与你协作的其它同学不会叫起来，你干吗给我这么多的数据(比如好几百G的文件)我怎么处理得过来，你别怪他因为他不是搞大数据的，你可以跟他讲我把数据放在队列里你使用的时候一个个拿，这样他就不在抱怨了马上灰流流的去优化他的程序去了，因为处理不过来就是他的事情。Hbase：这是Hadoop生态体系中的NOSQL数据库，他的数据是按照key和value的形式存储的并且key是唯一的，所以它能用来做数据的排重，它与MYSQL相比能存储的数据量大很多。把大问题拆解成小问题然后进行分析解决。.
复制链接

扫一扫

小浣熊的技术 CSDN认证博客专家 CSDN认证企业博客

码龄2年

257: 原创

104万+: 周排名

127万+: 总排名

32万+: 访问

: 等级

2945: 积分

329: 粉丝

44: 获赞

14: 评论

338: 收藏

私信

关注

热门文章

最新评论

神经网络算法入门书籍,bp神经网络算法的优点
m0_72819507: 请问这本书叫什么呢？还有请问利用单因素试验数据在matlab训练bp神经网络之后如何得出一组最佳的仿真参数呢？感谢您
python实现简单的神经网络,python实现神经网络算法
sjq131313: 无用内容
图像识别最好的算法,图片相似度识别算法
存雪: 你的文档结构性太差，阅读起来很不方便。看完了，学到了一些东西，但就是我说的问题，希望能优化一下
图像识别最好的算法,图片相似度识别算法
m0_71020588: SOS：找朋友圈的小伙伴们请教一下，如何实现实时摄像头画面下，打开一本纸质书的任意一个页面，被某种视觉技术（模型、算法，包括但不限于，比如Python Yolo v5）进行图像识别、目标侦测，然后自动快速匹配到后端服务器的与纸质书配套的电子版的同一个页面，并且在前端屏幕上打开，满屏展示，//// 想在想有项目上实现以上功能，技术栈electron+vue3( ts 、node) , 谈好价格，可以在云队友等平台接单。亲人们，请帮我转发，谢了！————我的微信，xiaobai47007
python 全栈开发百度网盘,python全栈开发实战pdf
送你一匹马09: 人家就是骗点击的。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。