自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

夜星

学生哥一枚

  • 博客(3)
  • 收藏
  • 关注

转载 spark文件操作简单实例

目录[-] 1、准备文件 2、加载文件 3、显示一行 4、函数运用  (1)map  (2)collecct  (3)filter  (4)flatMap  (5)union  (6) join  (7)lookup  (8)groupByKey  (9)sortByKey 1、准备文件 ? 1

2015-09-02 16:24:34 697

转载 Spark中加载本地(或者hdfs)文件以及SparkContext实例的textFile使用

默认是从hdfs读取文件,也可以指定sc.textFile("路径").在路径前面加上hdfs://表示从hdfs文件系统上读   本地文件读取 sc.textFile("路径").在路径前面加上file:// 表示从本地文件系统读,如file:///home/user/spark/README.md ‍ 网上很多例子,包括官网的例子,都是用textFile来加载一个文件创建RD

2015-09-02 16:13:14 485

原创 基于Ubuntu 14的hadoop全分布集群搭建

1、安装前的准备 安装环境:3台一样的虚拟机Ubuntu 14+hadoop2.6.0+java1.8.0 虚拟机:VMware 虚拟机ip地址以及hostname主机名: 192.168.238.128 slaver1 192.168.238.129 slaver2 192.168.238.130 master

2015-08-28 10:39:13 345

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除