自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一直在路上的求知人。

一直在路上的求知人。

  • 博客(5)
  • 资源 (27)
  • 收藏
  • 关注

原创 Spark相关参数

应用配置 spark.app.name spark任务应用名称,在SparkUI界面以及日志数据中使用 spark.driver.cores spark,driver进程使用的CPU core数量,只有在cluster模式下生效 spark.driver.maxResultSize spark设置driver所有partitions序列化结果最大大小(最大1G),如果超过这个值,会占用

2016-11-30 10:22:38 2978

原创 Spark Standalone模式部署

Spark可以在Mesos或者YARN集群管理平台运行,也可以使用spark的standalone(独立)部署模式,主要用于本机测试用。 安装部署Spark需要是编译后的版本,可以到spark官网下载http://spark.apache.org/downloads.html 解压开(部署之前需要准备JAVA环境,配置JAVA_HOME) 运行脚本: ./sbin/start-mast

2016-11-23 15:35:07 824

转载 Spark数据倾斜调优

调优概述 有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜问题,以保证Spark作业的性能。 数据倾斜发生时的现象   1、绝大多数task执行得都非常快,但个别task执行极慢。比如,总共有1000个task,997个task都在1分钟之内执行完了,但是剩余两三

2016-11-20 11:04:52 526

原创 spark之RDD

Spark revolves around the concept of a resilient distributed dataset (RDD), which is a fault-tolerant collection of elements that can be operated on in parallel. There are two ways to create RDDs:

2016-11-04 14:25:59 702

转载 海量数据面试题整理

海量数据面试题整理   1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?   方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。   s 遍历文件a,对每个url求取,然后根据所取得的值将url分别存储到1000个小文

2016-11-03 16:45:25 323

FontForge安装包

FontForge

2021-11-17

windows文件查看工具tail

文件查看工具tail

2020-12-08

Centos7中安装docker.pdf

Centos7中安装docker

2019-08-06

Hive on Spark源码分析DOC

Hive on Spark源码分析,实际场景中会遇到需求:将Hive默认的执行引擎MapReduce换成Spark或者Tez。

2017-12-18

机器学习实战.pdf

机器学习实战

2017-06-28

一线架构师实践指南(温昱).pdf

一线架构师实践指南(温昱).pdf

2017-06-28

实战Hadop:开启通向云计算的捷径

这本书对于初学来说还是很实用的,按照上面的实例来操作慢慢地了解

2013-12-26

SPRING技术内幕

SPRING技术内幕,很不错的一本书,推荐

2013-09-19

Spring3.0.2-API.chm

Spring3.0.2-API

2013-08-14

jfreechart-1.0.15.zip

jfreechart-1.0.15.zip

2013-08-11

定时出现div

定时出现div 改造一下 都适用 用jQuery实现就简单了 感兴趣可以自己试试用DOM编程

2013-08-01

jQuery1.8.3_20121215.chm

暂时还没看好不好用,和大家分享。

2013-07-27

JavaScript.chm

觉得对于如果是初学者来说,是一个不错的文档,内中含有不错的示例。

2013-07-27

计算机网络(第四版).PDF

计算机网络(第四版).PDF

2013-07-24

mysql数据库图形化界面

mysql数据库图形化界面。使用很方便,操作相对比较简单

2013-07-15

Notepad++记事本

Notepad++编辑器,个人觉得还是很不错的“多功能”记事本

2013-07-15

jfreechart

在网上找了半天一直都没有资源。自己去弄了一份,不过全是网页的,有需要chm格式的可以自己制作

2013-07-15

Ajax安全技术

Ajax安全技术

2013-07-11

Struts2.3.1.2_API.chm

struts2的帮助文档,希望有助大家学习

2013-07-09

struts2中常用jar包

struts2-all包中有一些是关联不上源码的,所以花了时间去网上把这么源码都收集可一下,自己也要用,分享给需要的

2013-07-09

PDF转成WORD工具

PDF文档转成WORD文档,更适合我们进行文字的修改。

2013-06-04

w3school帮助文档

从基础的HTML到XHTML,乃至进阶的XML、SQL、数据库、多媒体和WAP。 从左侧的菜单选择你需要的教程!

2013-06-04

java英文版API

这是java学习的必备良器,可以和中文对照看,有助于提高。

2013-05-19

单片机的一些新手程序

里面有一些新手单片机的编程,还有就是能遇到高手指导.

2011-02-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除