自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

张普的专栏

11月 10月 08月 07月 06月 02月

原创 SparkCore杂记二

这篇博客主要讲解Spark中任务shuffle与persistence, 首先来说说shuffle洗牌，学过hadoop的同学应该都了解mapreduce,每一个mapreduce任务都要经过一次shuffle，简单的理解shuffle就是根据key将数据进行重新分布，这个过程会发生文件IO/网络IO,是比较耗性能的一个操作，并且还有可能产生数据倾斜，简单说一下数据倾斜指每个任务中分配的数据不均匀

2017-11-08 20:36:59 301

原创 SparkCore杂记一

接触Spark也有一段时间了，最开始一直都是上网看一些博客，自己搭建个虚拟机倒腾，都是一些零散的学习，回头想想还是有必要系统性的学习、理解一遍，本系列博客将会参照spark 官方文档上来一一讲解，但是也不会仅仅只是翻译（翻译也不全面），其中还会加上一些自己的理解、在项目中的一些所见所闻，希望自己能够慢慢成长起来，如果理解有误还请各位指正。 Spark是基于内存计算的分布式处理系统，相对于

2017-11-08 18:01:01 499

Struts2.2.3

struts2参考手册，其中包含xwork框架部分的API

2014-09-08

Jquery1.10.3

jquery最新版1.10.3中文参考手册，详细介绍了Ajax、CSS、事件、属性、选择器等用法。

2014-09-08

tika.jar包

可直接通过java -jar tika.jar运行该jar包查看我们解析得到文本的结果

2014-07-26

Apache tomcat

此Apache-tomcat是安装类型，在安装时选择JDK，不用去配置文件中添加代码

2014-07-23

solr与tomcat整合

该文档详细讲解了solr如何整合到tomcat中，并且还有附有图片说明

2014-07-23

nutch工具包

Apache nutch 1.5 src的包

2014-07-13

Hadoop 2.2运行wordcount报错

2015-12-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除