自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据星球-浪尖

主要分享Spark使用及源码,spark 机器学习,图计算,同时会涉及到,如:hadoop,Hbase,Hive,Kafka。保证文章质量,给大家提供一个好的知识分享平台。

  • 博客(19)
  • 收藏
  • 关注

转载 干货 | 起底eBay Flink的上云之路

供稿 | Rheos Team 徐朝晖编辑 | 顾欣怡本文2238字,预计阅读时间7分钟更多干货请关注“eBay技术荟”公众号 导读Apache Flink作为低延迟、高吞吐的大数据计...

2019-12-31 17:19:30 550

转载 干货 | Flink在监控系统上的实践和应用

供稿 | Unified Monitoring Platform翻译&编辑 | 顾欣怡本文4377字,预计阅读时间14分钟更多干货请关注“eBay技术荟”公众号导读Sherlo...

2019-12-29 16:09:47 1321

转载 技术干货|eBay对流量控制说“so easy”!

转自:eBayTechRecruiting基于Kafka/Storm的实时流量控制系统量大货足5000字,超级技术干货认真阅读10分钟,给你十分收获这篇干货,你能看到什么? ...

2019-12-27 15:09:29 501

转载 干货 | 实践Hadoop MapReduce 任务的性能翻倍之路

供稿 | 李万雪本文4600字,预计阅读时间10分钟更多干货请关注“eBay技术荟”公众号摘要:eBay的CAL(Central Application Logging)系统负责收集eB...

2019-12-25 23:29:23 392

原创 Flink通过异步IO实现redis维表join

使用flink做实时数仓的公司越来越多了,浪尖这边也是很早就开发了一个flink 全sql平台来实现实时数仓的功能。说到实时数仓,两个表的概念大家一定会知道的:事实表和维表。在实时输出中...

2019-12-24 23:23:46 2614

转载 MySQL面试最全知识点!(下)

MySQL面试最全知识点!(上)上一篇内容的最后给大家分享了MVCC可以使用乐观锁和悲观锁,但是具体定义还没有阐述,本篇文章将对MySQL面试题知识点进行最后的总结。乐观锁与悲观锁的区别...

2019-12-21 23:29:25 207

转载 在 Kylin 中实现异常值检测 UD(A)F

本文讲解了时间序列数据异常值检测的基本概念和在 Kylin 中开发使用异常值检测 UDF 的方法,可以作为其他 UDF 开发的参考。通过在 Kylin 中移植 Hivemall 的 UD...

2019-12-18 20:23:21 498

转载 flink table窗口聚合的open函数未调用的bug分析

今天分析一下,flink table聚合udf AggregateFunction的open函数未被调用的bug。情景一:当然,对于udf的聚合操作,在flink里面有两种用法,一种是不...

2019-12-17 20:46:34 878 2

原创 Flink计算PV,UV的案例及问题分析

PV(访问量):即Page View, 即页面浏览量或点击量,用户每次刷新即被计算一次。UV(独立访客):即Unique Visitor,访问您网站的一台电脑客户端为一个访客。00:00...

2019-12-15 12:00:41 3406

转载 MySQL面试最全知识点!(上)

这篇文章是我花了几天时间对之前总结的MySQL知识点做了完善后的产物,可以用来回顾MySQL基础知识以及备战MySQL常见面试问题。由于本篇篇幅较长,将以上下两篇的形式分享出来,大家记得...

2019-12-13 23:55:56 297

转载 ZB级的大数据探索与应用实践【附PPT】

据报告显示到2025年,全球将产生180ZB的数据。这些海量的数据正是企业进行数字化转型的核心生产因素,然而真正被有效存储、使用和分析的数据不到百分之十。如何从ZB级的数据中寻找分析有价...

2019-12-12 22:40:31 889

原创 flink sql使用中的一个问题

最近有人问了浪尖一个flink共享datastream或者临时表会否重复计算的问题。对于 flink 的datastream ,比如上图,source 经过datastream计算之后的...

2019-12-11 23:22:50 1269

转载 再谈|Rowkey设计_HBase表设计

HBase的rowkey设计可以说是使用HBase最为重要的事情,直接影响到HBase的性能,常见的RowKey的设计问题及对应访问为:Hotspotting的行由行键按字典顺序排序,这...

2019-12-09 19:09:41 202

原创 网红程序员还是很难做的!

我是浪尖,运营公众号也有段时间了。浪尖是读书时间就喜欢收集整理技术文章,大学没毕业的时候我的csdn博客排名就是1w以内了。大数据相关运营开始于15年,其实刚开始是15年玩的大数...

2019-12-07 10:33:47 317

转载 程序员做什么才能摆脱996?

做梦!

2019-12-06 23:08:57 217

转载 CPU飙高,频繁GC,怎么排查?

处理过线上问题的同学基本上都会遇到系统突然运行缓慢,CPU 100%,以及Full GC次数过多的问题。当然,这些问题的最终导致的直观现象就是系统运行缓慢,并且有大量的报警。本文主要针对...

2019-12-05 23:20:11 299

转载 spark streaming offset的管理那些事儿

彻底讲解了spark streaming与kafka整合offset的管理的注意事项。初级的工程师可以详细看看。 ...

2019-12-04 22:48:10 295

转载 大牛总结的 Git 使用技巧,写得太好了!

作者:你喜欢吃青椒么juejin.im/post/5d157bf3f265da1bcc1954e6前言本文是参考廖雪峰老师的Git资料再加上我自己对Git的理解,记录我的Git学习历程,...

2019-12-03 22:23:13 166

转载 何谓SQL注入,这个漫画告诉你!

原文:https://jizhi.im/blog/post/sql_injection_intro先来看一副很有意思的漫画:今天我们来聊一聊SQL注入相关的内容。何谓SQL注入?SQ...

2019-12-01 20:58:41 267

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除