自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

微信搜:import_bigdata,大数据领域硬核原创作者

GitHub搜:https://github.com/wangzhiwubigdata/God-Of-BigData

  • 博客(1787)
  • 资源 (2)
  • 收藏
  • 关注

原创 2021-2022年最新版大数据面试题全面总结-持续更新

2021-2022大数据面试题全面总结

2021-01-10 12:55:40 4754 3

原创 大数据方向学习进阶知识图谱

总体描述:大数据开发岗位技能树,学习和复习总纲。关键词:面试 大数据 大纲正所谓,无招胜有招。愿读到这篇文章的技术人早日明白并且脱离技术本身,早登彼岸。一切技术最终只是雕虫小技。大纲本系列主题是大数据开发面试指南,旨在为大家提供一个大数据学习的基本路线,完善数据开发的技术栈,以及我们面试一个大数据开发岗位的时候,哪些东西是重点考察的,这些公司更希望面试者具备哪些技能。本...

2019-09-08 20:51:10 1263 1

转载 Presto介绍及常用查询优化方法总结

1、Presto简介Presto是Facebook开源的MPP(Massive Parallel Processing)SQL引擎,其理念来源于一个叫Volcano的并行数据库,该数据库提...

2021-12-08 16:41:38 7

转载 如何提升数据质量?(附实战文档)

一、前言数据质量保障的关键的步骤是数据质量规则、数据质量指标,数据探查,数据保障机制和数据清洗,不管是在做数据质量或者打算做数据质量工作的朋友都可以详细研究下,应该会有帮助。本篇包含数质量...

2021-12-07 07:40:00 6

原创 【Spark重点难点】你的代码跑起来谁说了算?(内存管理)

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜《我们在学习Spark的时候,到底在学习什么?》《我在B站读大学,大数据专业》Spark源码阅读的正确打开方式前言在之前的课中我们...

2021-12-07 07:40:00 25

原创 2021-2022大数据学习面试不完全指南(推荐收藏)

2021-2022年大数据学习面试不完全指南

2021-12-05 17:10:40 236

原创 【Spark重点难点】你的数据存在哪了?

《我们在学习Spark的时候,到底在学习什么?》《我在B站读大学,大数据专业》前言在之前的课中我们讲了Spark的RDD以及整个Spark系统中的一些关键角色:《【Spark重点难点】你从...

2021-12-04 18:44:13 145

原创 互联网最坏的时代可能真的来了

本文由【王知无】原创,首发于 CSDN博客!本文首发CSDN论坛,未经过官方和本人允许,严禁转载!本来我的【Spark重点难点系列】今天要发的文章已经写完了。但是有两个读者的留言让我内心十分煎熬,我觉得有必要拿出来分享一下。前两天有一篇《互联网大厂程序员梦醒时分》文章刷屏,如果你没看过可以百度搜一下。这篇文章里详细讲解了目前整个互联网的形势,我在2021年初的时候写过一篇《2021年,开发者的落日》。文中仅仅从技术方面分析了目前开发领域对大家的一些挑战,基于对2021年整个互联网技术从业者的

2021-12-03 21:16:05 238

原创 【Spark重点难点】你以为的Shuffle和真正的Shuffle

我们的【Spark重点难点】系列继续更新。以往的系列:我们在学习Spark的时候,到底在学习什么?我在B站读大学,大数据专业【Spark重点难点01】你从未深入理解的RDD和关键角色通俗解...

2021-12-02 07:40:00 144

原创 【Spark重点难点】你从未深入理解的RDD和关键角色

OK了,桑不啦pipo,today我们start更新Spark的重点难点系列了。前言之前我们成功完成了Flink重点难点部分的学习了。很多同学可能还没有意识到,你已经把Flink这个框架中...

2021-12-01 19:00:00 469

转载 零售业电商标签从0到1的构建方法

导读:本文手把手教大家构建一套完整的零售行业标签类目体系。背景D电商是一家零售电子商务公司,布局了集线上交易、线下物流、金融、社区于一体的生态链路,拥有该细分行业内领先的全品类一站式交易平...

2021-12-01 19:00:00 69

转载 企业级大数据架构设计及规划方案.ppt

八千里路云和月 | 从零到大数据专家学习路径指南我们在学习Flink的时候,到底在学习什么?193篇文章暴揍Flink,这个合集你需要关注一下Flink生产环境TOP难题与优化,阿里巴巴藏...

2021-11-30 08:25:00 10

转载 干货收藏!快速掌握用户画像项目的开发流程(附流程图)

导读:随着大数据技术的深入研究与应用,企业的关注点日益聚焦在如何利用大数据来为精细化运营和精准营销服务,而要做精细化运营,首先要建立本企业的用户画像。在画像系统的项目规划阶段需要明确好项目...

2021-11-30 08:25:00 13

转载 阿里数据中台OneID核心能力之ID-Mapping

这篇文章是我的一个好友彭文华彭总写的, ID Mapping是阿里巴巴数据中台的核心能力之一。欢迎大家添加彭总微信:shirenpengwh ,一起探讨大数据相关技术。网上 ID Map...

2021-11-29 07:50:00 61

转载 OneData建设探索之路之数仓建设

背景随着业务的发展,频繁迭代和跨部门的垂直业务单元变得越来越多。但由于缺乏前期规划,导致后期数仓出现了严重的数据质量问题,这给数据治理工作带来了很大的挑战。在数据仓库建设过程中,我们总结的...

2021-11-29 07:50:00 14

转载 基于Hive数据仓库的标签画像实战

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜本期内容主要介绍使用Hive作为数据仓库的应用场景时,相应的库表结构如何设计。Hive数据仓库建立用户画像首先需要建立数据仓库,用...

2021-11-28 08:30:00 27

原创 我的缅甸往事(二) | 惊魂南塘河

欢迎关注博客主页:微信搜:import_bigdata,大数据领域硬核原创作者_王知无(import_bigdata)_CSDN博客https://blog.csdn.net/u013411339欢迎点赞、收藏、留言 ,欢迎留言交流!本文由【王知无】原创,首发于 CSDN博客!本文首发CSDN论坛,未经过官方和本人允许,严禁转载!声明本文根据个人真实经历改编和演绎。文中所有出现的名字均为化名。本文出于分享和回忆记录的目的,不承担任何读者阅读此文带来的负面责任。本系列和技术无关,周末闲..

2021-11-27 13:07:18 329

转载 我在美团的八年

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜来源丨美团工云鹏昨天我刷到美团员工云鹏一篇技术好文,作者云鹏 2014 年加入美团,先后参与了美团酒店供应链体系、分布式调度系统的...

2021-11-26 08:30:00 150

原创 打工人不容易,程序员更不容易

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜我在周末的时候写了一篇《「大数据成神之路」第四版更新完毕》。文末大概提了一句关于:各个大公司发布Q3财报国家反垄断局挂牌成立首先声...

2021-11-25 07:48:49 2477

原创 谈半年绩效了,我顺便给自己做了个总结

前两天和Leader聊绩效了。因为隔着双十一加上项目需求太多。没来得及做个自我总结,趁着闲暇的机会做个简单的自我总结。整体来看,上半年做的事情还是有头有尾,有结果的。自己所负责的项目和业务...

2021-11-23 08:20:00 714

原创 我在B站读大学,大数据专业

我在B站读大学,大数据专业

2021-11-22 20:37:17 1148

原创 我的缅甸往事(一) | 个人在缅甸的真实经历

我的缅甸往事(一) | 个人在缅甸的真实经历

2021-11-21 17:08:42 2175 6

原创 「大数据成神之路」第四版更新完毕

欢迎关注博客主页:微信搜:import_bigdata,大数据领域硬核原创作者_王知无(import_bigdata)_CSDN博客https://blog.csdn.net/u013411339欢迎点赞、收藏、留言 ,欢迎留言交流!本文由【王知无】原创,首发于 CSDN博客!本文首发CSDN论坛,未经过官方和本人允许,严禁转载!截止2021年11月20日,《大数据成神之路》第四个版本更新完毕。Github地址:《大数据成神之路》https://github.com/wangzhiwub..

2021-11-21 11:49:38 1179

原创 我把Flink的重点和难点部分更新完了

Hi,各位大佬。经过3个星期的总结和归纳,我把跟Flink相关的重点和难点更新完毕了。列表如下:《Flink重点难点:时间、窗口和流Join》《Flink重点难点:网络流控和反压》《Fl...

2021-11-18 08:30:00 185

原创 Kafka的运维利器-AdminClient

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜前言一般情况下,我们都习惯使用kafka-topics.sh脚本来管理主题,但有些时候我们希望将主题管理类的功能集成到公司内部的系...

2021-11-17 08:29:00 593

原创 Flink重点难点:Flink任务综合调优(Checkpoint/反压/内存)

在阅读本文之前,你应该阅读过的系列:《Flink重点难点:时间、窗口和流Join》《Flink重点难点:网络流控和反压》《Flink重点难点:维表关联理论和Join实战》《Flink重点难...

2021-11-16 08:30:00 527

原创 Kafka常用监控框架百科全书

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜Kafka搭建好投入使用后,为了运维更便捷,借助一些管理工具很有必要。Kafka社区似乎一直没有在监控框架方面投入太多的精力,目前...

2021-11-15 08:00:00 617

原创 老夫我写代码的起手式是怎么样的?

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜大家可能是武侠小说看多了。今天有个奇怪的读者问我:你好,请问接到一个需求,应该怎么下手写代码。我直接呵呵。这问题要放在刚毕业。我大...

2021-11-13 18:47:32 1063 1

原创 大数据只是听起来唬人?其实啥也不是。

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜各位读者大佬们晚上好。前两天一个读者找到我,问了一些问题。想来大家都是同龄人,虽然素不相识,但是我想起来我前几年刚毕业的时候,大概...

2021-11-11 22:52:24 2624 1

转载 193页PPT读懂《数字化转型方法论》,强烈建议收藏!

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜国云CEO马晓东写了本《数字化转型方法论》的书,这篇文章是明东亮用PPT形式写成的一篇读书笔记,体系化程度是很好的,主要阐述了数字...

2021-11-09 08:15:00 30

转载 Flink CDC 2.0 数据处理流程全面解析

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜8月份 FlinkCDC 发布2.0.0版本,相较于1.0版本,在全量读取阶段支持分布式读取、支持checkpoint,且在全量 ...

2021-11-08 08:10:00 86

原创 上帝视角Hbase二级索引方案全解析

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜什么是二级索引Coprocessor协处理器类型Coprocessor方案(Phoenix等)Phoenix二级索引特点非Copr...

2021-11-07 13:12:19 1616

转载 【大数据Java基础- Java并发 20】深入分析synchronized的实现原理

记得刚刚开始学习Java的时候,一遇到多线程情况就是synchronized,相对于当时的我们来说synchronized是这么的神奇而又强大,那个时候我们赋予它一个名字“同步”,也成为了我们解决多线程情况的百试不爽的良药。但是,随着我们学习的进行我们知道synchronized是一个重量级锁,相对于Lock,它会显得那么笨重,以至于我们认为它不是那么的高效而慢慢摒弃它。诚然,随着Javs SE 1.6对synchronized进行的各种优化后,synchronized并不会显得那么重了。下面跟随LZ一

2021-11-05 01:49:26 46

原创 Flink重点难点:状态(Checkpoint和Savepoint)容错与两阶段提交

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜在阅读本文之前,你应该阅读过的系列:《Flink重点难点:时间、窗口和流Join》《Flink重点难点:网络流控和反压》《Flin...

2021-11-04 08:00:00 125

转载 【大数据Java基础- Java并发 19】J.U.C之Condition

在没有Lock之前,我们使用synchronized来控制同步,配合Object的wait()、notify()系列方法可以实现等待/通知模式。在Java SE5后,Java提供了Lock接口,相对于Synchronized而言,Lock提供了条件Condition,对线程的等待、唤醒操作更加详细和灵活。下图是Condition与Object的监视器方法的对比(摘自《Java并发编程的艺术》):Condition提供了一系列的方法来对阻塞和唤醒线程:await() :造成当前线程在接到信号或被.

2021-11-03 00:52:48 58

转载 【大数据Java基础- Java并发 18】J.U.C之AQS:同步状态的获取与释放

在前面提到过,AQS是构建Java同步组件的基础,我们期待它能够成为实现大部分同步需求的基础。AQS的设计模式采用的模板方法模式,子类通过继承的方式,实现它的抽象方法来管理同步状态,对于子类而言它并没有太多的活要做,AQS提供了大量的模板方法来实现同步,主要是分为三类:独占式获取和释放同步状态、共享式获取和释放同步状态、查询同步队列中的等待线程情况。自定义子类使用AQS提供的模板方法就可以实现自己的同步语义。独占式独占式,同一时刻仅有一个线程持有同步状态。独占式同步状态获取acquire(i

2021-11-03 00:42:27 38

转载 Kafka常见问题&学习路径&源码阅读小结 | 写在Kafka3.0发布之际

严格来说,这篇文章也不是今天写的。是之前断断续续写在了几篇文章中。2021年9月21日,随着Kafka3.0的发布,Kafka在「分布式流处理平台」这个目标上的努力进一步得到加强!Kafk...

2021-11-02 08:20:00 26

转载 【大数据Java基础- Java并发 17】J.U.C之线程池:ScheduledThreadPoolExecutor

ScheduledThreadPoolExecutor解析我们知道Timer与TimerTask虽然可以实现线程的周期和延迟调度,但是Timer与TimerTask存在一些缺陷,所以对于这种定期、周期执行任务的调度策略,我们一般都是推荐ScheduledThreadPoolExecutor来实现。下面就深入分析ScheduledThreadPoolExecutor是如何来实现线程的周期、延迟调度的。ScheduledThreadPoolExecutor,继承ThreadPoolExecutor且实现

2021-11-01 00:06:08 41

原创 Hbase2.x新特性&Hbase常见问题性优化小总结

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜在很早之前,我曾经写过两篇关于Hbase的文章:《Hbase性能优化百科全书》《Hbase FAQ热门问答小集合》如果你没有看过,...

2021-10-30 22:33:18 529

转载 【大数据Java基础- Java并发 17】深入分析ThreadLocal

ThreadLoacal是什么?ThreadLocal是啥?以前面试别人时就喜欢问这个,有些伙伴喜欢把它和线程同步机制混为一谈,事实上ThreadLocal与线程同步无关。ThreadLocal虽然提供了一种解决多线程环境下成员变量的问题,但是它并不是解决多线程共享变量的问题。那么ThreadLocal到底是什么呢?API是这样介绍它的:This class provides thread-local variables. These variables differ from their no

2021-10-30 17:35:15 242

大数据面试大总结300页.zip

大数据面试大总结300页.zip

2021-07-18

300页Java和大数据面试.pdf

大数据最新面试题,300页!

2021-01-23

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除