大数据~~架构
一尘在心
这个作者很懒,什么都没留下…
展开
-
MongoDB + Spark: 完整的大数据解决方案
Spark介绍按照官方的定义,Spark 是一个通用,快速,适用于大规模数据的处理引擎。通用性:我们可以使用Spark SQL来执行常规分析, Spark Streaming 来流数据处理, 以及用Mlib来执行机器学习等。Java,python,scala及R语言的支持也是其通用性的表现之一。 快速: 这个可能是Spark成功的最初原因之一,主要归功于其基于内存的运算方式。当需要处理的...转载 2018-12-13 18:48:40 · 2767 阅读 · 0 评论 -
流计算框架 Flink 与 Storm 的性能对比
1. 背景Apache Flink 和 Apache Storm 是当前业界广泛使用的两个分布式实时计算框架。其中 Apache Storm(以下简称“Storm”)在美团点评实时计算业务中已有较为成熟的运用(可参考 Storm 的可靠性保证测试),有管理平台、常用 API 和相应的文档,大量实时作业基于 Storm 构建。而 Apache Flink(以下简称“Flink”)在近期倍受关注,...原创 2018-12-29 14:25:16 · 437 阅读 · 0 评论 -
大数据分析案例
https://www.cnblogs.com/cuiyansong/p/4881049.html转载 2019-07-23 11:09:21 · 718 阅读 · 0 评论