Elevenzzxp
码龄8年
关注
提问 私信
  • 博客:13,196
    社区:3
    动态:8
    13,207
    总访问量
  • 6
    原创
  • 1,661,325
    排名
  • 5
    粉丝
  • 0
    铁粉

个人简介:一枚sqlboy

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2017-04-10
博客简介:

qq_38263082的博客

查看详细资料
个人成就
  • 获得22次点赞
  • 内容获得1次评论
  • 获得14次收藏
创作历程
  • 5篇
    2022年
  • 1篇
    2018年
成就勋章
TA的专栏
  • Hadoop
    1篇
  • Spark学习
    3篇
  • Zookeeper
    1篇
兴趣领域 设置
  • 大数据
    hadoop
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Hive常用的调优方法

前言:Hive调优是日常工作中比较常见的问题,本文简要总结一下常用的调优方法。一、代码层面的优化1.去重两种方式:distinct和group by。推荐使用group by来对数据去重。distinct会将相同的key shuffle到一个reduce task中处理,group by 会启用多个reduce task来对数据进行分组去重。2. 在做具体业务时,尽量明确具体的字段内容,避免使用select * 。3.在使用join时,可以先过滤表中的数据之后再进行join。二、小文件过
原创
发布博客 2022.02.09 ·
3241 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

Spark 结构化API-DataFram、SparkSQL

本文主要介绍Spark中结构化API的使用
原创
发布博客 2022.01.28 ·
1436 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Zookeeper里Leader选举算法

Zookeeper里Leader选举算法
原创
发布博客 2022.01.25 ·
2392 阅读 ·
9 点赞 ·
0 评论 ·
3 收藏

WordCount程序

使用Java、Scala编写WordCount程序
原创
发布博客 2022.01.22 ·
1930 阅读 ·
4 点赞 ·
1 评论 ·
1 收藏

Spark数据分区的源码分析

这里我们主要分析一下 在Spark中创建RDD时候数据是如何分区的。以一个集合数据为例:val listRdd = sc.makeRDD(List(1,2,3,4))点进makeRDD方法makeRDD方法有两个参数:Seq:传入的序列numSlices:切片数,没有制定的会有默认的defaultParallelism,默认的切片数与本机的内核数有关点进parallelize方法,在点 getPartitions方法里的slice方法slice方法的逻辑:1.如果传入的numSlices&
原创
发布博客 2022.01.21 ·
875 阅读 ·
4 点赞 ·
0 评论 ·
1 收藏

这就是北漂啊

发布动态 2020.08.14

数学建模 Excel的应用

发布资源 2018.10.13 ·
ppt

python实现 斐波那契数列计算

描述斐波那契数列如下:F(0) = 0, F(1) = 1F(n) = F(n-1) + F(n-2)编写一个计算斐波那契数列的函数,采用递归方式,输出不超过n的所有斐波那契数列元素调用上述函数,完成如下功能:用户输入一个整数n,输出所有不超过n的斐波那契数列元素、输出数列的元素和及平均数,输出按照顺序,用英文逗号和空格分割此题目为自动评阅,请严格按照要求规范输入和输出...
原创
发布博客 2018.08.16 ·
3322 阅读 ·
3 点赞 ·
0 评论 ·
4 收藏