自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

xiayuhaisong的博客

大数据松松

CSDN认证博客专家 CSDN认证企业博客

码龄10年

34: 原创

6万+: 周排名

4万+: 总排名

4万+: 访问

: 等级

1138: 积分

698: 粉丝

770: 获赞

9: 评论

551: 收藏

私信

关注

热门文章

分类专栏

最新评论

OLTP、OLAP与HTAP、HSAP详解
weixin_42076366: up可以把错别字改一改嘛hhh
Spark之【性能调优】
放。756: "Spark的性能调优技巧非常实用，深入浅出地讲解了资源分配、内存管理、数据倾斜处理等关键点，对提升大数据处理效率帮助巨大。"
Spark之【性能调优】
放。756: "这篇文章详细解释了在Spark中如何通过使用广播变量来优化性能，减少内存消耗。这对于处理大规模数据集时特别有用。文章中提到，默认情况下，每个task都会获取外部变量的副本，这会导致大量内存使用。通过将变量广播到各个节点，task可以直接从本地的BlockManager获取数据，从而减少内存的消耗。这个优化技巧对于提高Spark应用程序的效率非常有帮助。"
HiveSQL经典面试题（建议点赞收藏）
m0_53114307: 留存率计算中的方案1才用lead函数计算，如果是不连续的则计算是不对的。
HiveSQL经典面试题（建议点赞收藏）
大数据松松: 没有分组就进行排序，那样会将所有的数据进行排序，没法区分是谁连续登录了

最新文章

数据仓库之Hive

关注

文章平均质量分 90

数据仓库hive开发的各种专项问题总结

关注数：文章数：4 文章阅读量：6578 文章收藏量：59

作者: 大数据松松

越努力越幸运

展开