大数据框图

最新推荐文章于 2024-07-11 16:34:57 发布

龙哥vw

最新推荐文章于 2024-07-11 16:34:57 发布

阅读量264

点赞数

分类专栏：大数据文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mlsoftware/article/details/104011768

版权

大数据专栏收录该内容

1 篇文章 0 订阅

订阅专栏

google三篇论文：

分布式文件系统 GFS
大数据分布式计算框架 MapReduce
NoSQL 数据库系统 BigTable
一句话概括即使分布式！通过大量廉价的机器构建集群，完成海量数据、存储计算的那些事儿

后来有了Hadoop：HDFS+Mapreduce，Yahoo很早就开始实用Hadoop（搜索主要干两个事，爬网页存起来，建索引，Hadoop可以说完美的解决了早起的搜索引擎的那些事儿）
Hadoop后来成为了Apache的顶级项目
后来Yahoo搞出来Pig，是一个类似sql语法的东东，经过变异转成了Mapreduce程序，运行在Hadoop上
Facebook推出Hive，这个是真的支持sql语法的

hadoop周边：

Sqoop，支持关系数据库数据的导入、导出到Hadoop
Flume，支持海量日志的收集、聚合、传输
Oozie，支持mapreduce的工作流调度引擎

MapReduce组成：

执行引擎
资源调度引擎，后来衍生出Yarn
Yarn：MapReduce的升级版，支持大数据计算迭代+利用内存，更快

批处理计算（大数据离线计算）：

MapReduce
Spark

大数据流计算（大数据实时计算）：

Storm
Flink
Spark Streaming

NOSQL：

Hbase，从Hadoop分离出来，基础HDFS的NoSQL系统
Cassandra

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据框图

google三篇论文：分布式文件系统 GFS大数据分布式计算框架 MapReduceNoSQL 数据库系统 BigTable一句话概括即使分布式！通过大量廉价的机器构建集群，完成海量数据、存储计算的那些事儿后来有了Hadoop：HDFS+Mapreduce，Yahoo很早就开始实用Hadoop（搜索主要干两个事，爬网页存起来，建索引，Hadoop可以说完美的解决了早起的搜索引擎的那些...
复制链接

扫一扫

专栏目录

龙哥vw CSDN认证博客专家 CSDN认证企业博客

码龄16年

15: 原创

21万+: 周排名

194万+: 总排名

3753: 访问

: 等级

175: 积分

2: 粉丝

0: 获赞

0: 评论

2: 收藏

私信

关注

热门文章

分类专栏

大数据 1篇
操作系统 1篇
x86 1篇
微信 1篇
社交 1篇
隐私 1篇
笔记
测试 1篇
css 1篇
selector 1篇
css selector quick reference 1篇
java 1篇
技术 2篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。