自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

sunlei1980的专栏

田小雨 CSDN认证博客专家 CSDN认证企业博客

码龄13年

56: 原创

8万+: 周排名

201万+: 总排名

19万+: 访问

: 等级

2040: 积分

49: 粉丝

39: 获赞

5: 评论

83: 收藏

私信

关注

热门文章

分类专栏

最新评论

数据中台建设的价值及数据中台架构
BSN研习社: 写的不错~
数字化转型的本质：“研产供销服”各环节的敏捷化
田小雨: 第一张图之前画的不完整，已做调整。
MapReduce编程之倒排索引
qq_43693144: hadoop源码博客，个人感觉非常不错，推荐给各位学友： Map终结和Spill文件合并 https://mp.csdn.net/mdeditor/84062495#
MapReduce编程之实现多表关联
baigp: 请教贴主一个问题：在Reducer阶段，做笛卡尔积之前，贴主将左表和右表的数据分别放的一个数组里（博客中的第117行和第129行）。在数据量很大（相当大）的情况下，数组占用的内存也会相当大，很容易导致内存溢出，请问贴主有什么办法解决这个问题吗？
hive之实现列转行
百里生长: max是为了去重，如果有group by 需求，可以写成select id,max(concat_ws('\t',collect_set(num))) from tab1 group by id;concat_ws不是分组函数

最新文章

大数据生态圈

关注

文章平均质量分 63

包含zookeeper/HDFS/YARN/Flink/Hive/Spark/HBase/ElasticSearch等产品组件的大数据生态圈，愿我趟过的坑能让你少走一些弯路。

关注数：文章数：36 文章阅读量：128416 文章收藏量：75

作者: 田小雨

厚积才能薄发！自己选择的路，再苦再累也要坚持走下去

展开