- 博客(2)
- 资源 (4)
- 问答 (1)
- 收藏
- 关注
原创 SparkStreaming
很多重要的应用要处理大量在线流式数据, 并返结果,比如社交网络趋势追踪,网站指标统计,广告系统,可以使用Spark Streaming来处理 流计算的处理流程一般包含三个阶段:数据实时采集、数据实时计算、实时查询服务 Spark Streaming可整合多种输入数据源,如Kafka、Flume、HDFS,甚至是普通的TCP套接字。经处理后的数据可存储至文件系统、数据库,或显示在仪表盘里 Sp...
2018-08-08 11:24:53 439
原创 Spark SQL与DataSet
Spark SQL的架构图 Spark SQL是用于结构化数据处理的Spark模块。与基本的Spark RDD API不同,Spark SQL提供的接口为Spark提供了有关数据结构和正在执行的计算的更多信息。在内部,Spark SQL使用此额外信息来执行额外的优化 Spark SQL执行计划生成和优化都由Catalyst完成 DataSet是分布式数据集合。Dataset是Spark ...
2018-08-01 16:59:16 2115
MyEventBus
2016-03-08
NFC开发onNewIntent的问题
2016-05-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人