自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

微信搜:import_bigdata,大数据领域硬核原创作者

GitHub搜:https://github.com/wangzhiwubigdata/God-Of-BigData

  • 博客(28)
  • 资源 (1)
  • 收藏
  • 关注

转载 菜鸟供应链实时数据技术架构的演进

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!本文来自阿里巴巴的缘桥的分享,讲解了菜鸟实时架构的演进过程以及Flink在其中扮演的作用。我们...

2019-12-30 00:00:00 336

转载 趣头条实战 | 基于Flink+ClickHouse构建实时数据平台

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!如果你对ClickHouse不了解,请参考:《你需要懂一点ClickHouse的基础知识》《战...

2019-12-29 00:00:00 1670

转载 Apache Flink新场景 | OLAP引擎

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!本文作者来自阿里巴巴的贺小令,探讨了Flink在OLAP中的应用,之前我个人写过两篇关于OLA...

2019-12-28 14:07:18 669

转载 15个多线程相关的面试题

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!By大数据技术与架构场景描述:Java并发编程问题是面试过程中很容易遇到的问题,提前准备是解...

2019-12-27 00:00:00 255

转载 说说Flink DataStream的八种物理分区逻辑

By大数据技术与架构场景描述:Spark的RDD有分区的概念,Flink的DataStream同样也有,只不过没有RDD那么显式而已。Flink通过流分区器StreamPartitio...

2019-12-26 00:00:00 876

转载 只有2G内存,在10G数据量怎样找到中位数?

题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的...

2019-12-25 00:00:00 822

转载 Spark面对OOM问题的解决方法及优化总结

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!Spark中的OOM问题不外乎以下两种情况map执行中内存溢出shuffle后内存溢出map执...

2019-12-24 00:00:00 298

转载 Spark 动态资源分配(Dynamic Resource Allocation) 解析

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!Spark 默认采用的是资源预分配的方式。这其实也和按需做资源分配的理念是有冲突的。这篇文章会...

2019-12-23 00:00:00 520

转载 Kafka的分区数与多线程消费探讨

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!典型的high-level Consumer的API如下: Properties props ...

2019-12-22 17:18:52 576

转载 Kafka源码阅读最最最简单的入门方法

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!1 消息处理入口以下是Kafka消息处理的入口,即客户端发送到服务端消息处理方法。/** ...

2019-12-21 20:50:07 417

转载 Yarn调度队列

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!1 概述在Yarn中,负责给应用分配资源的是Scheduler,并提供了多种调度器和可配置的策...

2019-12-20 08:00:00 315

转载 Apache Kafka 2.4.0 发布 | 求求你别更了~

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!Apache Kafka 2.4.0 已发布,此版本新增了不少新功能,其中包括:允许消费者从最...

2019-12-19 22:16:37 685

转载 State Processor API:如何读取,写入和修改 Flink 应用程序的状态

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!过去无论是在生产中使用,还是调研 Apache Flink,总会遇到一个问题:如何访问和更新 ...

2019-12-19 22:16:37 308

转载 一个简单的问题 | 分布式副本一致性

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!当我们开发大数据应用时, 通常会接触到数据一致性,通常为了提高数据的高可用性,防止单点数据故障...

2019-12-18 22:30:10 264

转载 Flink滑动窗口原理与细粒度滑动窗口的性能问题

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!By大数据技术与架构场景描述:Flink的窗口机制是其底层核心之一,也是高效流处理的关键。F...

2019-12-17 22:26:07 936 1

转载 分布式开放消息系统(RocketMQ)的原理与实践

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!By大数据技术与架构场景描述:这篇文章已经不能保证是否已经过时,由于当前的业务中也没有在使用...

2019-12-15 11:53:54 259

转载 下次我问你MySQL优化你要这么回答

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!By大数据技术与架构场景描述:说起MySQL的查询优化,相信大家收藏了一堆奇技淫巧:不能使用...

2019-12-14 15:38:29 286

转载 做数据开发就不需要了解G1了么?

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!最近在看关于G1垃圾收集的文章,看了很多国内与国外的资料,本文对G1的这些资料进行了整理。这篇...

2019-12-12 22:36:33 325

转载 基于Flink快速开发实时TopN

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!By大数据技术与架构场景描述:TopN 是统计报表和大屏非常常见的功能,主要用来实时计算排行...

2019-12-10 21:37:24 875

转载 使用 Apache Flink 开发实时 ETL

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!Apache Flink 是大数据领域又一新兴框架。它与 Spark 的不同之处在于,它是使用...

2019-12-09 22:12:16 496

原创 Apache Spark在海致大数据平台中的优化实践

本文来自由海致网络技术公司翟士丹分享。专注于大数据技术领域,Apache Spark Contributor,有丰富的Spark SQL引擎调优经验。海致全称海致网络技术公司,成立于2013年7月。作为一家技术驱动的创业型公司,海致的创始班底拥有丰富的技术经验。核心团队成员来自百度、微软、IBM、EMC、硅谷等知名企业的资深互联网专家。大数据数据平台的核心组成部分多数据整合自助式数据准备...

2019-12-08 19:00:14 1920

原创 企业级数据中台建设指南

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!By大数据技术与架构场景描述:本文围绕什么是数据中台,中台怎么建设,中台产品怎么选择,案例分...

2019-12-07 18:20:38 467

转载 不要给自己设限

这两天看到一个简历。从最基础的Java开发到数据开发到算法,甚至比较冷门的网络安全都有涉猎。然后就多聊了两句工作以外的事情。发现这位同学思路十分清晰,说话也很有条理。说起工作上的事情,思...

2019-12-05 22:23:01 229

原创 Flink 面试通关手册

概述2019 年是大数据实时计算领域最不平凡的一年,2019 年 1 月阿里巴巴 Blink (内部的 Flink 分支版本)开源,大数据领域一夜间从 Spark 独步天下走向了两强争霸的时代。Flink 因为其天然的流式计算特性以及强大的处理性能成为炙手可热的大数据处理框架。时至今日,Flink 已经发展到 1.9 版本,在大数据开发领域,面试中对于 Flink 的考察已经是大数据开发求职者...

2019-12-05 21:51:05 3000 2

原创 Flink面试通关手册

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!概述2019 年是大数据实时计算领域最不平凡的一年,2019 年 1 月阿里巴巴 Blink ...

2019-12-04 22:04:27 729

转载 Flink Source/Sink探究与实践:RocketMQ数据写入HBase

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!前言最近我们正在尝试把原有的一些Spark Streaming任务改造成Flink Strea...

2019-12-03 00:00:00 2263 1

原创 Spark/Flink广播实现作业配置动态更新

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!前言在实时计算作业中,往往需要动态改变一些配置,举几个栗子:实时日志ETL服务,需要在日志的格...

2019-12-02 00:00:00 832

转载 Flink全链路延迟的测量方式

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据! ...

2019-12-01 23:15:31 1331

大数据面试大总结300页.zip

大数据面试大总结300页.zip

2021-07-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除