大数据技术脉络

最新推荐文章于 2021-09-09 10:34:46 发布

落花生@u

最新推荐文章于 2021-09-09 10:34:46 发布

阅读量372

点赞数 1

分类专栏：大数据技术文章标签： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41774099/article/details/102733558

版权

大数据技术专栏收录该内容

9 篇文章 1 订阅

订阅专栏

本文以“大数据技术线”为线索铺开，从宏观视觉勾勒出各个大数据技术在大数据分析过程中不同阶段的不同使命。再从线的节点对应的大数据技术展开，谈及需要使用的工具。最后再将这些工具回归到hadoop的软件框架。笔者寄此构建个人的大数据知识框架，对细节没有过多赘述，后期会逐步细化框架内容，不足之处望严厉批评指出，笔者会校对修正。

大数据技术线

大数据技术线是大数据技术操作海量数据的抽象概念。它穿插在hadoop大数据软件框架中，涉及海量数据的转载、提取，到分布式存储、处理、计算及流式计算、可视化等大数据技术。

1024程序员勋章占位
想要走完大数据技术线的每个技术节点，必须假设我们已经有大数据相关知识的基础，比如linux基础、hadoop基础等。若假设不成立，则需要继续阅读后面的内容。

Sqoop

Sqoop(ETL工具)，就是用来提取、加载、转储数据的工具。比如再一个软件、库中提取、整理、分析的数据需要导入另外一个软件、库中，就需要ETL工具。比如在hdfs,Hive（仓库）,Hbase,Mysql等数据储存系统中数据的转移。在这里插入图片描述

Hive

hive，也被叫做基于hadoop的大数据仓库。它使用类Sql语言，向HDFs拿取保存数据的映射关系，本身是不储存数据的，适合大数据集的批作业处理。
在这里插入图片描述

Hbase

HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。相比于Hdfs,hbase可看成是对Hdfs的补充，habase能够实现实时单个记录的查询。
在这里插入图片描述

Spark

Spark有四个主要核心组件——Spark SQL、Spark Streaming、MLlib、GraphX，它是一个用于大规模数据处理的一站式分析引擎，类似于hadoop的开源集群计算环境，但将计算任务分配到内存上进行，速度更快。能够运行在多中集群管理器上，支持多种编程语言，支持多种数据类型的接入。spark的社区是目前最活跃的大数据社区。
在这里插入图片描述

Hadoop

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。它的核心技术是分布式储存（HDFS）和分布式处理（MapReduce）。
在这里插入图片描述

在这里插入图片描述

小结

hadoop是一个分布式系统基础架构，hdfs和mapreduce、yarn是其核心。由于hadoop的宽松特性，在hadoop的其架构上安装其他组件如hive、hbase，sqoop等,使得hadoop分布式系统的性能更加贴近海量数据环境下的商业需求。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

落花生@u CSDN认证博客专家 CSDN认证企业博客

码龄7年

39: 原创

7万+: 周排名

147万+: 总排名

4万+: 访问

: 等级

835: 积分

34: 粉丝

64: 获赞

38: 评论

171: 收藏

私信

关注

热门文章

分类专栏

项目-分析-报告 4篇
大数据技术 9篇
Python 7篇
算法原理-笔记 8篇
R 3篇
MYSQL 2篇
Power BI 2篇
excel 3篇
小程序 1篇

最新评论

【Power BI desktop 】在汽车行业的运用——车企决策仪
xzyuni: 有详细的教程吗或者做好的POWERBI能发我一份吗？
【Power BI】分析仪在餐饮业中的应用
家师曹先生: 我一直以为KPI是指员工的业绩
【GridStudio】从0到1 [搭建+启动] 神级编辑器GridStudio
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客介绍了搭建和启动神级编辑器GridStudio的过程，让我们更加深入理解其实现原理。我觉得博主可以继续写一篇关于GridStudio的插件开发技巧和实践经验的技术文章，这样的内容对其他用户也会很有帮助。相信会有更多读者期待博主的下一篇文章。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
【Power BI】分析仪在餐饮业中的应用
窗飞雪: 案例数据能分享一下吗？
【Power BI】分析仪在餐饮业中的应用
Andy-cmd 回复落花生@u: 好的，已经关注了呢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

落花生@u 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。