Spark
文章平均质量分 91
frank1998819
这个作者很懒,什么都没留下…
展开
-
浅谈Spark应用程序的性能调优(转)
Spark是基于内存的分布式计算引擎,以处理的高效和稳定著称。然而在实际的应用开发过程中,开发者还是会遇到种种问题,其中一大类就是和性能相关。在本文中,笔者将结合自身实践,谈谈如何尽可能地提高应用程序性能。 分布式计算引擎在调优方面有四个主要关注方向,分别是CPU、内存、网络开销和I/O,其具体调优目标如下: 1.提高CPU利用率。 2.避免OOM。 3.降低网络开销。 4.减少I/O操作。 第...原创 2016-01-21 15:02:19 · 180 阅读 · 0 评论 -
mmTrix大数据分析平台构建实录 (转)
http://www.iteye.com/news/31475在数据分析中,有超过90%数据都是来自于非结构化数据,其中大部分的是日志,如运维、安全审计、用户访问数据以及业务数据等,但随着互联网快速的发展,数据规模也是水涨船高,从早前的GB级到现在的TB级,甚至PB级也只是短短几年光景。而移动互联网的时代到来,可以说每个人无时无刻不在产生数据,几乎成爆发式的增长。如此多的数据早已压榨完单机的...原创 2016-04-06 15:39:25 · 107 阅读 · 0 评论