王知无的Java到大数据之路~

欢迎关注‘大数据技术与架构’微信公众号~个人微信:whispererrr

Java和大数据面试通关要点

原文又梁桂钊编写,个人新增了大数据部分面试以及部分Java语言基础 ## 简历篇 * 请自我介绍 * 请介绍项目 ## 基础篇 ### 基本功 面向对象的特征 final, finally, finalize 的区别 int 和 Integer 有什么区别 重载和重写的区别 抽象类和接口...

2019-02-28 21:02:37

阅读数 111

评论数 0

大数据成神之路(持续更新)

大家好,本人目前在某BAT公司任职大数据工程师,自2010年开始接触大数据,至今已经有N多年了,从一无所知的小白到一线互联网公司虽然坎坷,却也收货良多。决心写下这个大数据成神之路文章。 欢迎关注‘大数据技术与架构’ 微信公众号,获取更多关于Spark、flink、hadoop的资料下载。 ...

2019-02-09 22:28:34

阅读数 248

评论数 0

数据不撒谎,Flink-Kafka性能压测全记录!

本文作者来自本号的粉丝:林夕_Yume,作者微信:wxid_nvd5wwng4v2i22欢迎大家关注他的简书:https://www.jianshu.com/u/3fa2...

2019-08-23 00:00:00

阅读数 20

评论数 0

菜鸟在物流场景中基于Flink的流计算实践

本文作者:马汶园(花名:晨蕊)演讲标题:《菜鸟在物流场景中基于Flink的流计算实践》嘉宾简介:北京邮电大学硕士,2017年加入菜鸟网络,从事菜鸟实时数据设计与开发,对利...

2019-08-22 00:00:00

阅读数 5

评论数 0

Spark Core源码解析29连击

《Spark源码精度计划1|SparkConf》《SparkCore源码精读计划2|SparkContext组件初始化》《SparkCore源码精读计划3|...

2019-08-21 00:00:00

阅读数 7

评论数 0

基于Flink构建实时数据仓库

本文是来自2019年Apache Flink Meetup深圳站的资料,作者是OPPO的大数据平台负责人,本文主要讲述了OPPO基于Flink如何构建实时数据仓库。本文从...

2019-08-21 00:00:00

阅读数 9

评论数 0

Airbnb | 如何应用Druid实现大数据实时批量分析

挑战和未来的改进虽然Druid在我们的数据平台架构中为我们提供了很好的服务,但随着我们在公司内部使用Druid的增长,存在新的挑战。我们处理的问题之一是每天产生的需要加载...

2019-08-20 00:00:00

阅读数 8

评论数 0

程序员的幽默你不懂

程序员这个群体很幽默如果和程序员们接触久了,你们可能就会感觉他们是一群逗比熟悉的人们之间,他们真的可以很逗,玩笑,自嘲,张口即来固有的,陈旧的,老的印象已经不符合现代程序...

2019-08-17 00:00:00

阅读数 14

评论数 0

一个细节 | Java中asList的缺陷

今天在项目中的一段代码用了asList方法,出现了问题。作者于是仔细查看了asList的源码,在实际项目中避免出现错误的使用方式。希望对大家有帮助。在实际开发过程中我们经...

2019-08-16 00:00:00

阅读数 11

评论数 0

Druid实时OLAP数据分析存储系统极简入门

简介Druid 是一个开源的,分布式的,列存储的,适用于实时数据分析的存储系统,能够快速聚合、灵活过滤、毫秒级查询、和低延迟数据导入。Druid在设计时充分考虑到了高可用...

2019-08-15 00:00:00

阅读数 25

评论数 0

聊聊page cache与Kafka之间的事儿

本文作者:LittleMagic本文来源:https://www.jianshu.com/p/92f33aa0ff52前言关于Kafka的一个灵魂拷问:它为什么这么快?或...

2019-08-14 00:00:00

阅读数 48

评论数 0

Spark调优 | Spark SQL参数调优

前言Spark SQL里面有很多的参数,而且这些参数在Spark官网中没有明确的解释,可能是太多了吧,可以通过在spark-sql中使用set -v 命令显示当前spar...

2019-08-13 00:06:47

阅读数 29

评论数 0

Flink 网络传输优化技术

作为工业级的流计算框架,Flink 被设计为可以每天处理 TB 甚至 PB 级别的数据,所以如何高吞吐低延迟并且可靠地在算子间传输数据是一个非常重要的课题。此外,Flin...

2019-08-12 01:26:38

阅读数 14

评论数 0

周末分享 | 别让你的她等太久

—THE END —

2019-08-11 01:41:40

阅读数 4

评论数 0

Flink Exactly-Once 投递实现浅析

本文作者:Paul Lin文章来源:https://www.whitewood.me随着近来越来越多的业务迁移到 Flink 上,对 Flink 作业的准确性要求也随之进...

2019-08-10 00:00:00

阅读数 5

评论数 0

Apache Kylin 从零开始构建Cube(含优化策略)

前言Apache Kylin采用“预计算”的模式,用户只需要提前定义好查询维度,Kylin将帮助我们进行计算,并将结果存储到HBase中,为海量数据的查询和分析提供亚秒级...

2019-08-09 00:00:00

阅读数 11

评论数 0

Flink/Spark 如何实现动态更新作业配置

由于实时场景对可用性十分敏感,实时作业通常需要避免频繁重启,因此动态加载作业配置(变量)是实时计算里十分常见的需求,比如通常复杂事件处理 (CEP) 的规则或者在线机器学...

2019-08-08 00:00:00

阅读数 12

评论数 0

Redis单线程?别逗了,Redis6.0多线程重磅来袭!

2019年的 RedisConf 比以往时候来的更早一些,今年会议时间是4月1-3号,仍然是在旧金山鱼人码头Pier 27。恰逢今年是 Redis 第10周年,规模也比以...

2019-08-07 00:00:00

阅读数 50

评论数 0

Apache Spark3.0什么样?一文读懂Apache Spark最新技术发展与展望

简介:阿里巴巴高级技术专家李呈祥带来了《Apache Spark 最新技术发展和3.0+ 展望》的全面解析,为大家介绍了Spark在整体IT基础设施上云背景下的新挑战和...

2019-08-06 00:00:00

阅读数 19

评论数 0

Kafka 已落伍,转角遇见 Pulsar!

自 LinkedIn 2011 年创建了 Apache Kafka 后,这款消息系统一度成为大规模消息系统的唯一选择。为什么呢?因为这些消息系统每天需要传递数百万条消息,...

2019-08-05 00:00:00

阅读数 87

评论数 0

提示
确定要删除当前文章?
取消 删除