2018年11月_brz_em

11月 10月 09月 08月 07月

原创 kafka

KAFKA kafka简介分布式流处理平台，可以实时简单处理流数据，而且是一个分布式的，容错的，多副本的临时存储系统。 Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者规模的网站中的所有动作流数据。一般应用在大数据日志处理或对实时性（少量延迟），可靠性（少量丢数据）要求稍低的场景使用。官网：http://kafka.apache.org kafka特点： Apache...

2018-11-15 15:01:16 394 1

原创消息队列

消息队列简介消息队列中间件是分布式系统中重要的组件，主要解决应用耦合，异步消息，流量削锋等问题。实现高性能，高可用，可伸缩和最终一致性架构。是大型分布式系统不可缺少的中间件。目前在生产环境，使用较多的消息队列有ActiveMQ，RabbitMQ，ZeroMQ，Kafka，MetaMQ，RocketMQ等。消息队列应用场景介绍以下介绍消息队列在实际应用中常用的使用场景。异步处理，应用解耦，流...

2018-11-10 21:25:22 169

原创 Spark --补充

RDD 编程补充： 1.数值RDD的统计操作 Spark对包含数值数据的RDD提供了一些描述性的统计操作，Spark的数值操作是通过流式算法实现的，允许以每次一个元素的方式构建出模型。这些统计数据都会在调用stats()时通过一次遍历数据计算出来，并以StatsCounter对象返回。方法含义 count() RDD中的元素个数 mean() 元素的平均值 sum() ...

2018-11-10 21:04:18 284

Spark Streaming SparkStreaming概述 SparkStreaming概念 Spark Streaming类似于Apache Storm，用于流式数据的处理。官方文档介绍，Spark Streaming有高吞吐量和容错能力强等特点。Spark Streaming支持的数据输入源很多，例如：Kafka、Flume、Twitter、ZeroMQ和简单的TCP套接字等等。数据输...

2018-11-10 20:54:32 419

原创 Spark SQL and DataFrames

Spark SQL and DataFrames Spark SQL Spark SQL概述什么是Spark SQL？ SparkSQL是spark用来处理结构化数据的一个模块，它提供了一个编程抽象叫做DataFrames，并且作为分布式SQL查询引擎的作用。为什么要学SparkSQL? SparkSQL将Spark SQL转换为RDD，然后提交到集群执行，执行效率非常快，比如hive是将hi...

2018-11-09 21:14:04 643

CentOS安装jdk

CentOS安装jdk,超级详细

2018-09-07

Eclipse汉化包

2018-08-18

飞行棋,通过设置关卡，竞速小游戏

飞行棋100格的小型的游戏棋盘对战的双方轮流掷骰子控制自己的骑兵前进或者后退,在棋盘上设置关卡普通地雷暂停时空隧道在控制台上显示棋盘并显示当前玩家在棋盘上的位置

2018-08-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客&brz

原创 kafka

原创消息队列

原创 Spark --补充

原创 Spark Streaming

原创 Spark SQL and DataFrames

CentOS安装jdk

Eclipse汉化包

飞行棋,通过设置关卡，竞速小游戏

空空如也

原创 kafka

原创 消息队列

原创 Spark --补充

原创 Spark Streaming

原创 Spark SQL and DataFrames

CentOS安装jdk

Eclipse汉化包

飞行棋,通过设置关卡，竞速小游戏

空空如也

原创消息队列