自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

微信搜:import_bigdata,大数据领域硬核原创作者

GitHub搜:https://github.com/wangzhiwubigdata/God-Of-BigData

  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

转载 转行大数据的高薪捷径我为你找到了

#现在入行大数据晚了吗?|文末有 1 元福利昨天朋友问我,现在做大数据是不是晚了?我说,是晚了!现在活着也有点晚了。当然这是在抬杠,但今天还是聊聊大数据的发展。大数据在这个互联网时代...

2020-04-29 10:30:05 448

转载 来看看一个大二学生的Spark练习题

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!今天查资料的时候看到一个朋友的博客写的很好,加了好友,对方表示大二的学生,写的Spark的练习...

2020-04-28 22:37:49 1140

转载 Spark on Hive & Hive on Spark,傻傻分不清楚

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!上车前需知Spark on hive 与 Hive on Spark 的区别Spark on ...

2020-04-25 23:50:26 6547 3

转载 Spark SQL是如何选择join策略的?

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!前言我们都知道,Spark SQL上主要有三种实现join的策略,分别是Broadcast h...

2020-04-20 21:25:10 244

转载 关于SparkSQL的开窗函数,你应该知道这些!

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!1.概述介绍相信用过MySQL的朋友都知道,MySQL中也有开窗函数的存在。开窗函数的引入是为...

2020-04-20 21:25:10 472

转载 PID算法和Spark实现反压的原理

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!1. 前言Spark Streaming在处理不断流入的数据时通过每间隔一段时间(batch ...

2020-04-19 18:30:59 615 1

转载 HDFS的SecondaryNameNode作用,你别答错了

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!《分享一张Hadoop技术栈大图》中的源文件找到会发出来,稍安勿躁。前言HDFS Second...

2020-04-15 20:51:25 519

转载 分享一张Hadoop技术栈大图

如下,画这么一张图,不容易。大家可以把图合并到自己的总结中去。 ...

2020-04-14 08:00:00 535

转载 深入理解CAP理论和适用场景

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!本文出自:https://blog.csdn.net/new_com/article/det...

2020-04-13 19:56:30 896

转载 阅读源码|Spark 与 Flink 的 RPC 实现

近日常有同学来问我如何阅读代码,关于这个问题的一般性答案我特别提了一个问题并自问自答。出于提供一个实际的例子的考量,正好此前综合地阅读 Spark 的 RPC 实现、Flink 基于 ...

2020-04-12 19:15:46 402

转载 三万六千字通关MySQL面试

本文作者:ThinkWon,感谢提供这么详细的资源。数据库基础知识为什么要使用数据库数据保存在内存优点:存取速度快缺点:数据不能永久保存数据保存在文件优点:数据永久保存缺点:1)速度比...

2020-04-12 19:15:46 761

转载 Filter(过滤)|Project(映射)|Pushdowns(谓词下推)

1. Filter(过滤) 和 Project(映射)在传统的 OLAP 系统中,在进行 Join 的时候使用过滤和映射会极大的提高性能。同样的,在 Hadoop 中使用 Filte...

2020-04-09 11:30:00 1076

转载 Flink常见异常和错误信息小结

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!Flink的常见异常众多,不可能面面俱到,所以想到哪儿写到哪儿,有漏掉的之后再补充。部署和资...

2020-04-08 19:48:22 3666

转载 Hive SQL50道练习题

建表create table student(s_id string,s_name string,s_birth string,s_sex string) row format del...

2020-04-02 20:52:26 496

转载 年薪30w还是白菜价?大数据工程师凭什么?

2020刚开始,这一场突如其来的疫情,企业告急,学校延迟开学,延迟开工,取消考试及比赛、应届生面临着开学即毕业的尴尬、更多人面临着失业……相比之下,大数据行业岗位供不应求,企业对有实战...

2020-04-01 20:00:00 609

转载 HBase生产环境优化不完全指南

HBase使用定位:大规模数据+高并发+毫秒级响应的OLTP实时系统(数据库)。集群部署架构HBase集群一旦部署使用,再想对其作出调整需要付出惨痛代价,所以如何部署HBase集群是使...

2020-04-01 20:00:00 462

大数据面试大总结300页.zip

大数据面试大总结300页.zip

2021-07-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除