自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(14)
  • 收藏
  • 关注

转载 Flink,Storm,SparkStreaming性能对比

Yahoo 的 Storm 团队曾发表了一篇博客文章 ,并在其中展示了 Storm、Flink 和 Spark Streaming 的性能测试结果。该测试对于业界而言极 具价值,因为它是流处理领域的第一个基于真实应用程序的基准测试。该应用程序从 Kafka 消费广告曝光消息,从 Redi...

2019-09-05 10:23:00 182

转载 最简单流处理引擎——Kafka Streams简介

Kafka在0.10.0.0版本以前的定位是分布式,分区化的,带备份机制的日志提交服务。而kafka在这之前也没有提供数据处理的顾服务。大家的流处理计算主要是还是依赖于Storm,Spark Streaming,Flink等流式处理框架。Storm,Spark Streaming,Fli...

2019-09-04 11:16:00 301

转载 超越Storm,SparkStreaming——Flink如何实现有状态的计算

流式计算分为无状态和有状态两种情况。无状态计算观察每个独立的事件,Storm就是无状态的计算框架,每一条消息来了以后和前后都没有关系,一条是一条。比如我们接收电力系统传感器的数据,当电压超过240v就报警,这就是无状态的数据。但是如果我们需要同时判断多个电压,比如三相电路,我们判断三相电都高...

2019-09-03 17:47:00 390

转载 可以穿梭时空的实时计算框架——Flink对时间的处理

Flink对于流处理架构的意义十分重要,Kafka让消息具有了持久化的能力,而处理数据,甚至穿越时间的能力都要靠Flink来完成。在Streaming-大数据的未来一文中我们知道,对于流式处理最重要的两件事,正确性,时间推理工具。而Flink对两者都有非常好的支持。Flink对于正确性的...

2019-09-02 12:36:00 232

转载 替代Flume——Kafka Connect简介

我们知道过去对于Kafka的定义是分布式,分区化的,带备份机制的日志提交服务。也就是一个分布式的消息队列,这也是他最常见的用法。但是Kafka不止于此,打开最新的官网。我们看到Kafka最新的定义是:Apache Kafka® isa distributed streaming pla...

2019-08-30 11:26:00 222

转载 数据架构的未来——浅谈流处理架构

​ 数据架构设计领域正在发生一场变革,其影响的不仅是实时处理业务,这场变革可能将基于流的处理视为整个架构设计的核心,而不是将流处理只是作为某一个实时计算的项目使用。本文将对比传统数据架构与流处理架构的区别,并将介绍如何将流处理架构应用于微服务及整体系统中。传统数据架构​ 传统数据架构是一...

2019-08-29 10:17:00 174

转载 Flink快速入门--安装与示例运行

flink是一款开源的大数据流式处理框架,他可以同时批处理和流处理,具有容错性、高吞吐、低延迟等优势,本文简述flink在windows和linux中安装步骤,和示例程序的运行。首先要想运行Flink,我们需要下载并解压Flink的二进制包,下载地址如下:https://flink.apa...

2019-08-28 13:28:00 274

转载 Kafka监控工具汇总

对于大数据集群来说,监控功能是非常必要的,通过日志判断故障低效,我们需要完整的指标来帮我们管理Kafka集群。本文讨论Kafka的监控以及一些常用的第三方监控工具。一、Kafka Monitoring首先介绍kafka的监控原理,第三方工具也是通过这些来进行监控的,我们也可以自己去是实现...

2019-08-23 11:49:00 123

转载 实时计算大数据处理的基石-Google Dataflow

​ 此文选自Google大神Tyler Akidau的另一篇文章:Streaming 102: The world beyond batch​ 欢迎回来!如果您错过了我以前的帖子,Streaming-大数据的未来,强烈建议您先花时间阅读那篇文章。简要回顾一下,上一篇我们介绍了Streami...

2019-08-22 16:07:00 125

转载 Streaming-大数据的未来

分享一篇关于实时流式计算的经典文章,这篇文章名为Streaming 101: The world beyond batch那么流计算如何超越批处理呢?从这几个方面说明:实时流计算系统,数据处理模式,还有大数据的未来。一、实时流式计算系统实时流式计算的意义:1、企业渴望获得更及时的数据...

2019-08-21 15:44:00 129

转载 Kafka之Producer

通过https://www.cnblogs.com/tree1123/p/11243668.html 已经对consumer有了一定的了解。producer比consumer要简单一些。一、旧版本producer0.9.0.0版本以前,是由scala编写的旧版本producer。入口类...

2019-08-19 16:57:00 93

转载 Kafka之Producer

通过https://www.cnblogs.com/tree1123/p/11243668.html 已经对consumer有了一定的了解。producer比consumer要简单一些。一、旧版本producer0.9.0.0版本以前,是由scala编写的旧版本producer。入口类...

2019-08-19 16:47:00 146

转载 Kafka单线程Consumer及参数详解

请使用0.9以后的版本:示例代码 Properties props = new Properties(); props.put("bootstrap.servers", "kafka01:9092,kafka02:9092"); props.put("group.id"...

2019-08-16 10:18:00 1234

转载 什么是Kafka?

通过Kafka的快速入门 https://www.cnblogs.com/tree1123/p/11150927.html能了解到Kafka的基本部署,使用,但他和其他的消息中间件有什么不同呢?Kafka的基本原理,术语,版本等等都是怎么样的?到底什么是Kafka呢?一、Kafka简介...

2019-08-15 16:15:00 77

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除