大数据的奇妙冒险
码龄6年
关注
提问 私信
  • 博客:129,291
    社区:206
    问答:145
    动态:14,244
    143,886
    总访问量
  • 36
    原创
  • 1,258,630
    排名
  • 2,435
    粉丝

个人简介:金融业大数据领域项目经理,持有PMP及系统架构设计师证书

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2018-11-03
博客简介:

大数据的奇妙冒险

博客描述:
Learning BIG DATA,just subscribe to me
查看详细资料
个人成就
  • 获得178次点赞
  • 内容获得26次评论
  • 获得497次收藏
  • 代码片获得162次分享
创作历程
  • 4篇
    2023年
  • 26篇
    2022年
  • 7篇
    2021年
  • 1篇
    2020年
成就勋章
TA的专栏
  • 大数据面试八股文
    6篇
  • 大数据
    19篇
  • hive
    8篇
  • MySQL
    2篇
  • Kafka
    4篇
  • 数据仓库
    3篇
  • Oracle
    2篇
  • Java
    2篇
  • 经验分享
    4篇
  • 算法与数据结构
    2篇
兴趣领域 设置
  • 大数据
    hadoophivesparkflink大数据
  • 后端
    架构
  • 服务器
    linux
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

图文并茂 | 水平分表的路由策略有哪些?什么是一致性哈希?

本文讲了什么是水平分表,以及几种常见的水平分表路由策略,每种策略的优缺点,最后讲了一致性哈希
原创
发布博客 2023.10.27 ·
412 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

大数据平台的安全认证一般是用什么实现的?

一文讲解 Kerberos 认证
原创
发布博客 2023.05.29 ·
364 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

通俗易懂:什么是拉链表

按照度娘的解释:“拉链表是一种针对数据仓库设计中表存储数据的方式而定义的数据模型,它有点类似于快照,用于维护历史状态及最新状态数据。假如有张表如表1-1所示,每天的数据量大概有50w表中有些字段会被 update,如表1-2,且每天更新的数据量很小,大约只有5k有些报表需要查看历史某个日期的数据存储空间有限,需要尽可能的节约存储空间你会怎么将其装入数仓中?
原创
发布博客 2023.03.30 ·
10524 阅读 ·
17 点赞 ·
4 评论 ·
77 收藏

高校二手交易商城微信小程序源码.rar

发布资源 2023.02.20 ·
rar

大数据相关面试题.rar

发布资源 2023.02.20 ·
rar

大数据面试 Hive 八股文

发布资源 2023.02.20 ·
pdf

博时基金数据开发面经

博时基金数据开发面经
原创
发布博客 2023.01.03 ·
804 阅读 ·
2 点赞 ·
0 评论 ·
5 收藏

大数据面试八股文之 hive 篇

网上大数据开发工程师的面试题相对较少,且比较杂乱分散,有的甚至没有答案。为了广大数据人着想,总结了大数据面试题hive篇,并给出答案,希望能有所帮助。
原创
发布博客 2022.12.12 ·
1872 阅读 ·
4 点赞 ·
0 评论 ·
34 收藏

大数据面试题:用 SQL 查询每个用户最大连续登录日期

“如何用 SQL 查询每个用户最大连续登录日期?”这道题是数据开发面试经常问到的题目,因为其比较考验候选人的 SQL 能力,今天就来简单讲讲其思路。
原创
发布博客 2022.12.06 ·
1004 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

Hive优化方法汇总

Fetch 抓取是指,Hive 中对某些情况的查询可以不必使用 MapReduce 计算。例如:SELECT * FROM employees;在这种情况下,Hive 可以简单地读取 employee 对应的存储目录下的文件,然后输出查询结果到控制台。在 hive-default.xml.template 文件中 hive.fetch.task.conversion 默认是 more,老版本 hive 默认是 minimal,该属性修改为 more 以后,在全局查找、字段查找、limit 查找等都不走ma
转载
发布博客 2022.12.02 ·
1861 阅读 ·
0 点赞 ·
0 评论 ·
14 收藏

浅谈 Hive 数据倾斜原因及解决方案

大数据开发过程中,经常会遇到数据倾斜的问题,也是面试必问的问题。今天就来说一下数据倾斜的原因及其解决方法。
原创
发布博客 2022.12.02 ·
1005 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

面试官:你了解数据湖吗?翻译翻译什么是数据湖

什么是数据湖?它和数据仓库有什么区别?和大数据平台有什么关系?看这篇就知道
原创
发布博客 2022.11.11 ·
435 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

爱了爱了

发布动态 2022.07.03

什么是视图?普通视图和物化视图什么区别?看这一篇就明白了

视图可以理解为一张表或多张表的预计算,这些表称为基表。它可以将所需要查询的结果封装成一张虚拟表,基于它创建时指定的查询语句返回的结果集。视图具有以下特点:例如:物化视图对于普通视图而言,其真实数据在基表中,即每次查询视图都是需要执行查询语句。有时候为了防止每次都查询,将结果集存储起来,这种有真实数据的视图,称为物化视图。什么情况下适合用物化视图?基表没有很多 DML,且每次查询都需要耗费较大资源的情况下,可以考虑用物化视图。物化视图的创建是这样的:① BUILD IMMEDIATE 创建物化视图的时
原创
发布博客 2022.06.20 ·
9053 阅读 ·
14 点赞 ·
0 评论 ·
33 收藏

呜呜,竟然有我,激动

发布动态 2022.06.15

JVM 之类加载器

JVM(Java Virtual Machine)是一个可以执行 Java 字节码文件(即 .class 文件)的虚拟机进程。当 Java 源文件能被成功编译成 .class 文件,就能在不同平台上的不同版本的 JVM 运行,因为 JVM 能将相同的 .class 文件解释称不同平台的机器码。正是因为 JVM 的存在,Java 被称为与平台无关的语言。一般而言,.java 文件经过编译后会得到 .class 文件,而将这个文件加载到内存之前需要先通过类加载器,先简单过一下图:类加载的过程为: 加载–>连接(
原创
发布博客 2022.06.02 ·
1668 阅读 ·
1 点赞 ·
1 评论 ·
1 收藏

大数据行业前景如何?有什么岗位?什么要求?一次讲清楚

最近一直有人问我,大数据行业前景怎么样?如果转行的话有什么岗位?有什么要求?为了解答这一系列问题,我觉得还是有必要科普一下大数据岗位的情况。大数据,毋庸置疑,行业前景是很不错的。现在是数据时代,近几年一直在强调数字化转型,互联网就不用多说,很多传统企业都在转型。而今年有个国家重点工程“东数西算”,指通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。可想而知,大数据的发展只会越来越好,就业机会也会越来越多。在应用上,大数据在互联网
原创
发布博客 2022.06.01 ·
870 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

数据分析的待遇怎么样?有什么要求?用爬虫和图告诉你

数据分析待遇如何?有啥要求?一次讲清楚
原创
发布博客 2022.06.01 ·
169 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

面试官抛出一段简单的 Java 代码,叫我解释其运行结果

看似简单的 Java 代码,实则考察了很多东西,欲知如何,进来看看便知
原创
发布博客 2022.05.28 ·
256 阅读 ·
1 点赞 ·
1 评论 ·
1 收藏

当我面对讨人厌的同事时

发布动态 2022.05.24
加载更多