Hdoop 概念与理解

最新推荐文章于 2022-11-28 10:51:23 发布

yostkevin

最新推荐文章于 2022-11-28 10:51:23 发布

阅读量579

点赞数

分类专栏：大数据文章标签： hadoop生态圈

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014384314/article/details/80452644

版权

大数据专栏收录该内容

33 篇文章 0 订阅

订阅专栏

一.计算引擎 ----mapreduce

1.map操作

2.reduce操作

3.spark transformation操作与action操作

4.mapreduce与spark的优虐

二.分布式存储 ----hdfs

1.文件备份（3份）

2.数据如何在各个节点均匀分布

3.如何映射到hive表

4.块大小，为什么要设置这么大的块？

5.hbase如何将data存储到hdfs

6.导入数据到hdfs的几种方式（sqoop,kettel,spark）

7.导出数据到文件、关系型数据库、excel的方式

三 .Hadoop生态圈概念

1.kafka

2.zookeeper

3.flume

4.hive

5.hbase

6.oozie

7.hue

8.impala

9.提交模式：YARN、spark standalone、local

四 .实时处理框架spark streaming与storm+kafka +hbase+web展示+tablealue展示

本篇主要介绍第一、第二章，后面两章只做简单概念介绍，之后会分篇详细讨论每一个模块。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hdoop 概念与理解

一.计算引擎 ----mapreduce1.map操作2.reduce操作3.spark4.mapreduce与spark的优虐二.分布式存储 ----hdfs1.文件备份（3份）2.数据如何在各个节点均匀分布3.如何映射到hive表4.块大小，为什么要设置这么大的块？5.hbase如何将data存储到hdfs6.导入数据到hdfs的几种方式（sqoop,kettel,spark datafram...
复制链接

扫一扫

专栏目录

yostkevin CSDN认证博客专家 CSDN认证企业博客

码龄10年

103: 原创

5万+: 周排名

2万+: 总排名

19万+: 访问

: 等级

2398: 积分

56: 粉丝

87: 获赞

22: 评论

281: 收藏

私信

关注

热门文章

分类专栏

vertica 6篇
ftp 1篇
任务调度 1篇
数据治理 1篇
kafka
面试项目
druid 1篇
部署 1篇
docker
大数据 33篇
shell 6篇
springboot 1篇
python 2篇
Hase 1篇
cdh
centos7.2安装 1篇
git安装与使用
linux 4篇
SPARK 10篇
flink 4篇
idea 2篇
sql 14篇
java 8篇
sparksql 4篇
mysql 1篇
datax 3篇
phoenix
time tool
pgsql 4篇
hbase

最新评论

vertica-java-自定义函数类(UDX)的部署
紫小筱: 非常好的教程，谢谢。我在文章里的连接找到了传固定个数的参数的代码： public class Add2intsInfo extends ScalarFunctionFactory { @Override public void getPrototype(ServerInterface srvInterface, ColumnTypes argTypes, ColumnTypes returnType) { argTypes.addInt(); argTypes.addInt(); returnType.addInt(); } public class Add2ints extends ScalarFunction { @Override public void processBlock(ServerInterface srvInterface, BlockReader arg_reader, BlockWriter res_writer) throws UdfException, DestroyInvocation { do { long a = arg_reader.getLong(0); long b = arg_reader.getLong(1); res_writer.setLong(a+b); res_writer.next(); } while (arg_reader.next()); } } 我要的是字符串，所以用的方法是 addVarchar，不是addInt
idea 连接github
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)使用更多的站内链接；(3)增加除了各种控件外，文章正文的字数。
数据结构-双向链表、栈、队列、优先队列与堆
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
vertica 实时消费kafka 例子
CSDN-Ada助手: SpringBoot项目里，如何做异步计算，异步计算超时和异常处理你会怎么做呢？
geomesa hbase demo
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。