自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

wusuopuBUPT的专栏

https://github.com/wusuopubupt

  • 博客(6)
  • 资源 (24)
  • 收藏
  • 关注

转载 Spark mapPartitions()操作

原文地址:http://apachesparkbook.blogspot.com/2015/11/mappartition-example.html---mapPartitions() can be used as an alternative to map() & foreach(). mapPartitions() is called once for each Partition

2016-11-21 12:11:47 2684

原创 Spark数据分区

Spark程序可以通过分区来减少网络通信开销。分区并非对于所有场景都是有好处的:比如, 如果给定RDD只被扫描一遍,那么完全没有必要做分区, 只有当数据多次在诸如连接这种基于键的操作时,分区才会有帮助。 假设我们有一份不变的大文件userData, 以及每5分钟产生的小数据events, 现要求在每5分钟产出events数据后, userData对events做一次join操作。 该过程的代码

2016-11-20 00:55:02 2451 1

原创 Spark Pair RDD操作

Spark Pair RDD操作1. 创建Pair RDDval pairs = lines.map(x => (x.split(" ")(0), x)2. Pair RDD的转化方法表1 Pair RDD的转化方法(以键值对集合{(1,2), (3,4), (3, 6)}为例) 函数名 目的 示例 结果 reduceByKey() 合并具有相同键的值 rdd.reduce

2016-11-19 12:14:04 1264

转载 Spark内存参数调节

原文地址: http://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-2/--In the conclusion to this series, learn how resource tuning, parallelism, and data representation affect

2016-11-15 10:29:55 1985 2

转载 Hive VS HBase

原文地址:https://www.xplenty.com/blog/2014/05/hive-vs-hbase/---Comparing Hive with HBase is like comparing Google with Facebook - although they compete over the same turf (our private information)

2016-11-14 13:54:09 1426

原创 Spark RDD基本操作

Spark RDD Scala语言编程RDD(Resilient Distributed Dataset)是一个不可变的分布式对象集合, 每个rdd被分为多个分区, 这些分区运行在集群的不同节点上。rdd支持两种类型的操作:转化(trainsformation)和行动(action), Spark只会惰性计算rdd, 也就是说, 转化操作的rdd不会立即计算, 而是在其第一次遇到行动操作时才去计算,

2016-11-13 20:32:19 5035

hadoop MapReduce介绍

hadoop MapReduce介绍 SergeBazhievsky_Introduction_to_Hadoop_MapReduce_v2.pdf 很好的学习hadoop mapreduce计算框架的资料

2016-03-04

MinGW-5.1.6.rar

离线版的比较旧的(5.16)MinGW安装, 然后,把C:\MinGW\bin中的mingw32-make.exe 改名成为 make.exe,接着配置环境变量,结束~

2014-08-03

CodeIgniter2.0中文手册.chm

CodeIgniter2.0中文手册.chm 好好学习,天天向上

2014-02-28

计算机网络

计算机 网络 通信原理的讲解PPT 和学校学到的真不一样。

2013-12-09

php+mysql 八大动态网站开发 源代码

php+mysql 八大动态网站开发 源代码 非常好用,适合广大Php初学者/爱好者学习使用 也适合有经验的phper温习使用 书中的有些函数已经被php官网不推荐使用了,所以,用的时候最好参照php官网php.net/manual进行学习

2013-07-16

iluowu PHPCMS 模板

iluowu PHPCMS 模板 对程序员很有用哦

2013-04-08

GBK-UTF8转换工具好用

GBK UIF-8转换工具 对程序员们很有用哦

2013-04-08

jquery 手册 中文版

jquery 手册 中文版 强大的javascript 库!

2013-04-08

mysql 手册 中文版

mysql 手册 中文版 很好地学习工具

2013-04-08

php 手册 中文版

php 手册 中文版 很好的学习工具

2013-04-08

Java语言编写计算器程序_swing界面

Java语言编写计算器程序_swing界面

2013-01-14

社交网络中的信任推荐和好友搜索过滤算法研究

社交网络中的信任推荐和好友搜索过滤算法研究

2013-01-14

Java网络爬虫简单实现

Java网络爬虫简单实现

2013-01-14

Windows Builder

Windows Builder pro for eclipse 3.6 一款基于Eclipse SWT技术上的双向Java Gui设计软件。具备SWT设计以及Swing设计两个主要功能。该软件会被作为一个插件镶嵌入Eclipse以及其他一些兼容的IDEs中

2012-05-06

谷歌成长21位重要人物

谷歌成长21位重要人物谷歌成长21位重要人物谷歌成长21位重要人物谷歌成长21位重要人物

2011-06-26

北京邮电大学ACM的分析语言

北京邮电大学ACM 北京邮电大学ACM北京邮电大学ACM北京邮电大学ACM北京邮电大学ACM北京邮电大学ACM北京邮电大学ACM北京邮电大学ACM北京邮电大学ACM北京邮电大学ACM

2011-06-26

2011年大学生创新实验计划项目立项启动会PPT

2011年大学生创新实验计划项目立项启动会PPT

2011-06-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除