- 博客(6)
- 收藏
- 关注
原创 Using HDInsight tools to optimize hive script
Hive Job IssueBelow is a hive script coming from TPC-DS and I hadsubmitted to Microsoft Azure HDInsight cluster for a long time (more than twohours), but it was still in running status. Why it was s
2015-10-26 12:31:22 703
转载 Chord算法
虽然网上搜索CHord,一搜一大堆,但大多讲得不太清楚明白。今天发现一篇blog,图文并茂,逻辑清楚且易懂,特意转载收藏。作者:gnuhpc 出处:http://www.cnblogs.com/gnuhpc/P2P的一个常见问题是如何高效的定位节点,也就是说,一个节点怎样高效的知道在网络中的哪个节点包含它所寻找的数据,如下图:对此,有三种比
2015-04-15 10:25:13 502
转载 Kafka剖析(一):Kafka背景及架构介绍
Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark都支持与Kafka集成。InfoQ一直在紧密关注Kafka的应用以及发展,“Kafka剖析”专栏将会从架构设计、实现、应用场景、性能等方面深度解析Kafka。背景介绍Kafka创建
2015-03-19 09:43:19 671
转载 分布式发布订阅消息系统 Kafka 架构设计
转自:http://www.oschina.net/translate/kafka-design参与翻译(4人):fbm, 飞翔的猴子, Khiyuan, nesteaa感谢这些同志们的辛勤工作,翻译的真不错,目前见到的最好的Kafka中文文章-------------------------------我们为什么要搭建该系统Kafka是一个消息系统,原本开
2014-11-18 12:21:11 595
原创 Transaction Topology
Storm 可以保证Tuple可以至少被处理一次,最常见的关于的Storm的问题是: 既然Storm可以被Replay, 那么它怎么能处理像计数统计这样的问题呢? 这样不会重复计数吗?在Storm0.7版本中提供了 transaction Topology这样的机制可以保证每个Tuple 精确的被处理一次。本文主要阐述transaction Topology基本概念和原理使用tr
2014-11-16 10:54:19 523
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人