Storm
文章平均质量分 93
Ransom0512
这个作者很懒,什么都没留下…
展开
-
大数据上的流式SQL引擎——StreamCQL
StreamCQL是一个类SQL的声明式语言,用于在流和可更新关系上的可持续查询,目的是在流处理平台分布式计算能力之上,开源前已在电信、金融等多个行业成功应用。此次开源便是让更多的开源爱好者用户体验进来转载 2016-01-06 11:30:55 · 3376 阅读 · 0 评论 -
KafkaStreams介绍(四) –架构
说明:本文是Confluent Platform 3.0版本中对于Kafka Streams的翻译。原文地址:https://docs.confluent.io/3.0.0/streams/index.html看了很多其他人翻译的文档,还是第一次翻译,有什么翻译的不好的地方还请指出。 这是Kafka Streams介绍的第四篇,以前的介绍如下:http://blog.csd翻译 2016-08-03 17:12:56 · 10117 阅读 · 0 评论 -
Twitter Heron阅读笔记
Twitter Heron阅读笔记说明:本文是《Twitter Heron: Stream Processing at Scale》的阅读记录整理,再结合网上其他资料整理而成,文中图片主要来自Heron论文和InfoQ上的宣传资料。Storm的问题所在Worker级别Storm在worker设计上的问题应该是最多的。 所有task都一视同仁,无法对单个Task进行资源设置,会造成比较严重的原创 2016-07-18 12:08:21 · 2711 阅读 · 2 评论 -
KafkaStreams介绍(三) –概念
说明:本文是Confluent Platform 3.0版本中对于Kafka Streams的翻译。原文地址:https://docs.confluent.io/3.0.0/streams/index.html看了很多其他人翻译的文档,还是第一次翻译,有什么翻译的不好的地方还请指出。 这是Kafka Streams介绍的第三篇,以前的介绍如下:http://blog.csd翻译 2016-07-26 18:53:00 · 12250 阅读 · 1 评论 -
Storm-Kafka源代码解析
Storm-Kafka源代码解析说明:本文所有代码基于Storm 0.10版本,本文描述内容只涉及KafkaSpout和KafkaBolt相关,不包含trident特性。Kafka SpoutKafkaSpout的构造函数如下:public KafkaSpout(SpoutConfig spoutConf) { _spoutConfig = spoutConf;}其构造参数来自于Spou原创 2016-01-11 15:21:18 · 7710 阅读 · 2 评论 -
StreamCQL源码阅读(4) 应用程序执行
本文转载自http://zqhxuyuan.github.io/如需转帖,请征得原作者同意StreamCQL应用程序执行流程前戏: CQL代码结构之前我们并没有梳理CQL部分的代码结构, 在分析了差不多的代码之后, 来看看每个部分都一一对应:还没有涉及的包括: PhysicalPlan,物理计划/逻辑计划优化器,executors执行器.转载 2016-01-07 09:04:44 · 810 阅读 · 0 评论 -
StreamCQL源码阅读(3) 拆分组合算子
本文转载自http://zqhxuyuan.github.io/如需转帖,请征得原作者同意StreamCQL的算子组成了Application前戏: buildApplication上篇在解析Schema的时候分析了CQL中一些常用的Statement syntax和对应的语法/语义解析器结果,现在继续ApplicationBuilder.build转载 2016-01-07 09:03:39 · 1219 阅读 · 0 评论 -
StreamCQL源码阅读(2) 语法和语义解析
本文转载自http://zqhxuyuan.github.io/如需转帖,请征得原作者同意StreamCQL的Schema以及语法和语义解析前戏: SemanticAnalyzer客户端提交的CQL语句经过Application.parse返回StatementContext(语法解析结果),再进入语义解析.如果是SubmitTask会触发之前的转载 2016-01-07 09:02:29 · 1328 阅读 · 0 评论 -
StreamCQL源码阅读(1) 提交任务
本文转载自http://zqhxuyuan.github.io/如需转帖,请征得原作者同意大数据上的流式SQL引擎—StreamCQL: http://www.csdn.net/article/2015-11-13/2826204http://www.csdn.net/article/2015-12-22/2826541IntroduceCQL(Co转载 2016-01-07 09:01:07 · 2052 阅读 · 0 评论 -
StreamCQL 1.1版本RoadMap
StreamCQL RoadMap特性列表 分组窗支持,支持在窗口中,按照指定字段进行分组。功能包含分组长度滑动窗,分组长度跳动窗,分组时间滑动窗,分组时间跳动窗。 支持Active, Deactive、rebalance功能,功能作用同Storm,rebanance只支持worker数量设置。 支持in、like、case、between表达式 添加RDBDatasource原创 2016-01-06 11:34:31 · 844 阅读 · 0 评论 -
SreamCQL架构解析,来自华为的开源流处理框架
StreamCQL是一个类SQL的声明式语言,它用于在流(streams)和可更新关系(updatable relation)上的可持续查询,目的是在流处理平台分布式计算能力之上,通过使用简易通用的类SQL语言,使得业务逻辑的开发变得统一和简易。在功能上,StreamCQL弥补了传统流处理平台上一些基本业务功能的缺失,除了过滤、转换等基本SQL能力之外, 还引入基于内存窗口的计算、统计、关联等能力,以及流数据的拆分、合并等功能。原创 2016-01-06 11:32:50 · 2063 阅读 · 0 评论 -
Kafka Stream介绍(—)
Kafka Stream介绍(—)介绍Kafka Stream – 举重若轻的强大Kafka stream。Apache Kafka开源项目的一个组成部分。是一个功能强大,易于使用的库。用于在Kafka上构建高可分布式、拓展性,容错的应用程序。它建立在流处理的一系列重要功能基础之上,比如正确区分事件事件和处理时间,处理迟到数据以及高效的应用程序状态管理。 下面的列表强调了Kafka Stream的翻译 2016-07-20 18:52:35 · 13719 阅读 · 0 评论