自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

OopsOutOfMemory盛利的博客

分布式计算||数据仓库||数据挖掘

  • 博客(22)
  • 收藏
  • 关注

原创 scala协变逆变上界下界---理解篇

如果你对面向对象的泛型bt

2014-04-30 12:02:28 9757 2

原创 scala implicit 隐式转换

我们经常在scala api doc 上看到类似implicit这个关键字。

2014-04-28 16:53:08 14261 3

原创 Spark Hadoop集群部署与Spark操作HDFS运行详解---Spark学习笔记10

目前spark的Run on的hadoop版本大多是hadoop2以上,但是实际上各个公司的生产环境不尽相同,用到2.0

2014-04-21 18:15:59 29629 2

原创 海量小文件网络传输copy优化

今天部署集群环境,拷贝了一下编译好的.class文件。

2014-04-21 15:46:11 6895

原创 Spark0.91使用sbt编译Unresolved依赖问题

最近测试一下spark0.91编译hadoop0.20.2-cdh3u5.经常出现

2014-04-21 14:13:58 8980

原创 Ubuntu12.04安装ganglia监控

Ganglia是UC Berkeley发起的一个开源实时监视项目,用于测量数以千计的节点,为云计算系统提供系统静态数据以及重要的性能度量数据。Ganglia系统基本包含以下三大部分。Gmond:Gmond运行在每台计算机上,它主要监控每台机器上收集和发送度量数据(如处理器速度、内存使用量等)。Gmetad:Gmetad运行在Cluster的一台主机上,作为Web Server,或者用于与W

2014-04-18 00:17:38 2308

原创 Spark0.91编译记录maven

最近新的版本发布了,听说修复了很多bug,专业人士说直接可以弃用0.81版本,直接0.91

2014-04-17 23:04:04 1865

原创 jvm调优--查找最耗CPU的代码

今天在公司用mvn编译的时候,出现机器卡死的情况,让我深深的反省了一下。

2014-04-17 11:25:00 5597 1

原创 RDD Dependency详解---Spark学习笔记9

RDD的最重要的特性之一就是血缘关系,血缘关系描述了

2014-04-16 18:38:43 6925

原创 Spark里几个重要的概念及术语

1. Application客户端的应用程序,

2014-04-16 17:27:54 15485 1

原创 Spark Streaming的WindowedDStream

Spark Streaming的 窗口操作的类WindowedDStream下面我们一起探究一下,Spark Streaming怎么实现chu

2014-04-15 18:34:48 4543

原创 Spark Streaming的窗口操作

1.Spark Streaming的Window Operation可以理解为定时的进行一定时间段内的数据的处理。

2014-04-15 18:16:24 21142

原创 Spark Streaming初探

Spark Streaming是一个基于Spark核心的扩展。主要y

2014-04-14 18:32:19 9363 4

原创 Scala中List的步长by

List中的步长List(1 to 100 by 2:_*) map (i=>i*i) sum

2014-04-11 18:40:43 4009

原创 Scala的cons,集合合并与添加

scala对集合的元素合有特殊的符号,比如::和:::简单说明一下:双冒号是连接 一个元素 和 一个集合

2014-04-11 16:30:23 5868 1

原创 Scala的foldLeft和foldRight

第一次看到/:这样的代码在别人的代码里,感觉很好奇,这是什么符号呢?

2014-04-11 16:16:20 28501 4

原创 Hive导入sequencefile错误

原因:自己上传的微

2014-04-09 18:18:44 5374

原创 Scala 的 yield

Scala 的 yield 例子 (for 循环和 yield 的例子)2012-09-28 — Unmi我看了《Programming in Scala》一书,仍然对 Scala yield 关键字的理解不甚清楚。起初我以为 Scala yield 的与 Ruby 的 yield 是一样,Ruby 中 yield 是被传入代码块的占位符。Scala 中的 yield 关键

2014-04-09 14:49:44 10595

原创 Spark RDD Action 详解---Spark学习笔记8

Spark RDD Action 详解配有实际例子

2014-04-04 17:46:20 13630 2

原创 Spark RDD Transformation 详解---Spark学习笔记7

这几天学习了Spark RDD transformation 和 action ,做个笔记记录下心得,顺便分享给大家。1. 启动spark-shell SPARK_MASTER=local[4] ./spark-shell.shWelcome to      ____              __       / __/__  ___ _____/ /__    _\ \/

2014-04-04 16:09:41 22264 2

原创 hiveUDAF求中位数

第一次写UDAF,拿中位数来练手。看下中位数定义:MEDIAN 中位数(一组数据按从小到大的顺序依次排列,处在中间位置的一个数或最中间两个数据的平均数)写成genericUDAF的形式1 2 3 4 中位数 2+3/2=2.51 2 3 中位数 2附上代码:package org.apache.hadoop.hive.ql.udf.generic;

2014-04-03 13:15:05 7920 1

原创 spark应用开发---Spark学习笔记6

如何部署和开发一个spark应用程序呢?首先要选好环境,我用的是incubator-spark-0.8.1-incubating,那么对应的是scala版本是2.9.3。如果使用maven或者sbt构建,则可以使用gavgroupId = org.apache.sparkartifactId = spark-core_2.9.3version = 0.8.1-incubatin

2014-04-03 00:05:54 3751

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除