自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据星球-浪尖

主要分享Spark使用及源码,spark 机器学习,图计算,同时会涉及到,如:hadoop,Hbase,Hive,Kafka。保证文章质量,给大家提供一个好的知识分享平台。

  • 博客(31)
  • 收藏
  • 关注

转载 世界上最会写爱情的人,其实是金庸

开篇之前,鱼叔先贴一首《天龙八部》的主题曲今天,娱乐圈一半的明星都在祝他生日。这个人叫——金庸大抵,有一半的演员,都演过他笔下的人物。林志颖→段誉黄晓明→杨过+韦小宝胡歌...

2018-10-31 00:00:00 416

转载 高级面试:JAVA内存模型

我们先来看一个反常识的例子。int a=0, b=0;public void method1() {  int r2 = a;  b = 1;}public void m...

2018-10-30 00:00:00 507

原创 细述hbase协处理器

1.起因(Why HBase  Coprocessor)HBase作为列族数据库最经常被人诟病的特性包括:无法轻易建立“二级索引”,难以执行求和、计数、排序等操作。比如,...

2018-10-29 00:00:00 314

转载 IT职场新人碰到的几个常见误区

来自:www.cnblogs.com/sankt/p/8658028.html作者:沐璟我工作10+年了,大概五年前从技术转管理后,多少还是发现一些职场新人职业发展的问题...

2018-10-28 00:02:15 403

原创 flink 有状态udf 引起血案一

场景最近在做一个画像的任务,sql实现的,其中有一个udf,会做很多事情,包括将从redis读出历史值加权,并将中间结果和加权后的结果更新到redis。大家都知道,fli...

2018-10-27 00:00:00 8849 12

原创 写个yarn的监控

在星球里和微信群里很多朋友都有疑惑,如何监控 yarn 上 spark 或者 mr 应用的存活状态,浪尖今天在这里分享一下实现方法,实际上只需要简单的几行代码即可。首先是...

2018-10-25 00:06:21 5691 1

原创 速抢:500份粉丝购书优惠券

10月24日当当计算机图书全场每满100减50!我们联合机械工业出版社华章科技特意为【spark学习技巧】粉丝申请了一批当当网“满100减20”的图书优惠码,可与封顶叠加...

2018-10-24 13:42:30 861

原创 RDD的join和Dstream的join有什么区别?

有人在知识星球里问:浪院长,RDD的join和Dstream的join有什么区别?浪尖的回答:DStream的join底层就是rdd的join。下面,我们就带着疑问去验证...

2018-10-23 00:00:00 1386

转载 如何成为一名优秀的架构师?

众所周知,架构师的角色,更偏向于策划、而非指挥,塑造、而非支配,其存在的意义,在于引导大家讨论、而非自己主宰一切。但是,具体应该如何执行呢?本文作者整理了 30 个公认的...

2018-10-22 00:00:00 175

转载 厉害了,天刚一冷程序员就都换上了衬衫。。

原文:转载自公众号【Java技术栈】这才农历九月初,大秋天的,深圳的天气就已经降温了。更搞笑的是,朋友圈、群里都在转发下面这张图片,相信大部分人已经看过了吧。这是哪家公司...

2018-10-21 00:03:33 229

转载 Redis 的各项功能解决了哪些问题?

原文:https://www.cnblogs.com/linianhui作者:blackheart先看一下Redis是一个什么东西。官方简介解释到:Redis是一个基于B...

2018-10-20 00:01:51 253

原创 Structured Streaming实现超低延迟

浪院长,最近忙死了,写文章的时间都没了。但是,都说时间就像海绵里的水,挤挤就有了。所以,今晚十点半开始整理这篇Structured streaming 相关的文章。最近,...

2018-10-19 00:00:54 2117 1

转载 针对 Hadoop 的 Oozie 工作流管理引擎的实际应用

本文操作性强,建议先收藏再仔细阅读,文章源码可以公众号后台输入1026获取。简介Apache Oozie 是用于 Hadoop 平台的一种工作流调度引擎。该框架(如图 1...

2018-10-18 00:06:06 352

转载 Flink高效的内存管理

如今,大数据领域的开源框架(Hadoop,Spark,Storm)都使用的 JVM,当然也包括 Flink。基于 JVM 的数据分析引擎都需要面对将大量数据存到内存中,这...

2018-10-17 00:01:09 1794

转载 Hive学习之Lateral View

Lateral view与UDTF函数如explode()一起使用,UDTF对每个输入行产生0或者多个输出行。Lateral view首先在基表的每个输入行应用UDTF,...

2018-10-16 00:03:38 1904 1

转载 Rowkey(行键)设计

本节介绍了 HBase 中的行键(Rowkey)设计。HotspottingHBase 中的行按行键按顺序排序。这种设计优化了扫描(scan),允许您将相关的行或彼此靠近...

2018-10-15 04:54:11 3254 1

转载 老司机也该掌握的MySQL优化指南

当MySQL单表记录数过大时,增删改查性能都会急剧下降,所以我们本文会提供一些优化参考,大家可以参考以下步骤来优化:一、单表优化除非单表数据未来会一直不断上涨,否则不要一...

2018-10-14 07:05:49 276

转载 中国IT工作者35岁后的发展出路调查报告

来自:https://blog.csdn.net/wksnm0724/article/details/6878598都说男人40一枝花,35岁恐怕还是花骨朵,正值事业发展...

2018-10-13 00:00:49 344 1

原创 推荐两个不错的flink项目

题外话,感觉文章可以就点击一些广告呗,谢谢。最近flink真是风生水起,但是浪院长看来这不过是阿里错过了创造spark影响力之后,想要在flink领域创建绝对的影响力。但...

2018-10-12 00:01:50 18396 4

原创 老司机常用的kafka监控-eagle

前面有文章说到了一个叫kafka manager的kafka管理工具,这个工具管理kafka确实很强大,但是没有安全认证,随便都可以创建,删除,修改topic,而且告警系...

2018-10-11 00:02:44 2162

原创 不可不知的zookeeper小工具-zkui

本文主要是首先带着大家回顾一下zookeeper在大数据中的作用,然后给大家介绍一款zk的监控管理工具。zookeeper在分布式集群的作用1,数据发布与订阅(配置中心)...

2018-10-10 00:02:45 806

原创 干货|kafka流量监控的原理及实现

工程能力作为一个优秀的开发人员,项目开发的过程中监控告警系统的可靠性是可以体现出一个人的工程管理能力的。优秀的监控告警系统可以免去很多精力消耗,比如维护,故障预判,故障及...

2018-10-09 00:00:00 4315

原创 大数据老司机的经验-走自己特色的技术路

浪尖的知识星球,现价179,国庆后第二天价格会提升至199元。浪尖写本文的主要原因就是在qq,微信群,及星球里发现很多提问者提的问题都是由于解决问题方式或思路不对导致的。...

2018-10-08 00:02:03 303

原创 深入系统掌握大数据

浪院长的知识星球创建3月左右,总用户340+人,在这里先谢谢老朋友的和粉丝的支持。其实,让我最为感慨的事情是,在整理本文的过程中发现,不知不觉在这100多天里输出了那么多...

2018-10-07 00:00:00 367

转载 中国互联网的沧海桑田

转自公众号:Duing(id:duyi-duing)中国互联网在2018年的暑假,走到了关键节点。不久前,54岁的张朝阳带领一批员工,在北京奥森公园以跑20公里的方式庆祝...

2018-10-06 02:08:51 1091

转载 Flume NG:Flume 发展史上的第一次革命

背景Cloudera 开发的分布式日志收集系统 Flume,是 hadoop 周边组件之一。其可以实时的将分布在不同节点、机器上的日志收集到 hdfs中。Flume 初始...

2018-10-05 00:04:04 244

转载 HBase 深入浅出

HBase 在大数据生态圈中的位置提到大数据的存储,大多数人首先联想到的是 Hadoop 和 Hadoop 中的 HDFS 模块。大家熟知的 Spark、以及 Hadoo...

2018-10-04 00:05:14 306

转载 一个老程序员的忠告:千万不要一辈子靠技术生存

我现在是自己做,但我此前有多年在从事软件开发工作,当回过头来想一想自己,觉得特别想对那些初学JAVA/DOT。NET技术的朋友说点心里话,希望你们能从我们的体会中,多少受...

2018-10-03 00:16:39 528 2

转载 “离开腾讯三个月,我才知道世界有多坏”

点击蓝字关注这个神奇的公众号~01这些年,身边不少朋友步入中年,都面临着一个艰难的选择,到底应该去大公司还是小公司。这个问题没有正确答案,完全看个人取舍。可最近听到的一个...

2018-10-02 00:00:00 476

转载 分布式服务框架 Zookeeper -- 管理分布式环境中的数据

安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础,最新的版本可以通过官网 http://hadoop.apache.org/zookee...

2018-10-01 00:11:27 180

转载 经典推荐|十一最值得去的地方

公司

2018-10-01 00:11:27 140

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除