自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (14)
  • 问答 (10)
  • 收藏
  • 关注

原创 Shuffle过程介绍

 摘要:腾讯分布式数据仓库基于开源软件Hadoop和Hive进行构建,TDW计算引擎包括两部分:MapReduce和Spark,两者内部都包含了一个重要的过程—Shuffle。本文对Shuffle过程进行解析,并对两个计算引擎的Shuffle过程进行比较。腾讯分布式数据仓库(Tencent distributed Data Warehouse, 简称TDW)基于开源软件Hadoop和Hiv...

2015-05-03 12:50:32 9214

转载 Shuffle 过程详解

Shuffle过程是MapReduce的核心,也被称为奇迹发生的地方。要想理解MapReduce, Shuffle是必须要了解的。我看过很多相关的资料,但每次看完都云里雾里的绕着,很难理清大致的逻辑,反而越搅越混。前段时间在做MapReduce job 性能调优的工作,需要深入代码研究MapReduce的运行机制,这才对Shuffle探了个究竟。考虑到之前我在看相关资料而看不懂时很恼火,所以在这里

2015-05-03 12:47:03 458

原创 java 二分查找法

public class QueryDemo { public static void main(String[] args) { int[] arr2 = new int[] { 11, 3,32,34, 45, 56, 78 }; System.out.println("67在数组中的位置:" + halfSearch(arr2, 11)); } public static

2015-05-03 10:19:14 641

原创 java 简单排序

public class SortDemo { public static void main(String[] args) { int[] arr = { 12, 3, 4, 56, 688, 9 }; bubbleSort(arr); selectSort(arr); print(arr); } // 选择 public static void selectSort

2015-05-03 10:15:23 761

转载 hbase 为什么查询比较快

第一、数据分区存储(region)  通过rowkey可以快速地位到在那个region上,位置信息保存在hbase的meta表里。 每次查询都会有location cache的,所以htable里面的Hconnection 初始化的时候访问速度相对来说稍慢,客户端缓存截图如下。 随着数据越来越大,meta表的查询有可能遇到瓶颈,建议单独独立出成一个meta server。

2015-05-01 18:51:51 3404 1

转载 避免regionServer宕机

因为regionserver 的管理信息主要记录在zookeeper,regionserver的宕机判断依据是session expired。ok那么regionserver 和Zookeeper的session expired原因有哪些尼?1. 网络不好。2. Java full GC, 这会block所有的线程。如果时间比较长,也会导致session exp

2015-05-01 18:43:24 397

java11多线程编程技术终极版--王者归来签名.pdf

Java8编程核心技术_完整版.pdf

2019-06-26

阿里巴巴开发手册终极版2019.pdf

阿里巴巴Java开发手册(终极版) ----京东卖40,这里只要3积分

2019-06-26

汪文君高并发编程实战视频 完整 未加密

汪文君高并发编程实战视频 完整 未加密汪文君高并发编程实战视频 完整 未加密汪文君高并发编程实战视频 完整 未加密汪文君高并发编程实战视频 完整 未加密汪文君高并发编程实战视频 完整 未加密

2018-12-22

ealsticsearch6.2.3.zip

ealsticsearch6.2.3.zip

2018-11-06

Logstash-Elsticsearch+kibana (阿里巴巴内部实现模型).pdf

Logstash-Elsticsearch+kibana (阿里巴巴内部实现模型).pdf

2018-11-06

elasticsearch服务器开发.pdf

elasticsearch服务器开发.pdf

2018-10-20

分布式链路追踪

分布式链路追踪介绍,阿里巴巴集团发布。

2018-10-20

db2安装使用手册.doc

db2安装使用手册.doc

2016-10-03

jredis-1.0-rc2.jar

jredis-1.0-rc2.jar

2016-10-03

oracle 编程高手

oracle 编程高手

2016-09-08

SoapUI使用手册.pdf

SoapUI使用手册.pdf

2016-06-05

jxl poi jar包

通过jxl/poi 实现excel导入导出需要使用的jar包

2015-06-21

HBase权威指南

HBase权威指南

2015-03-28

java面试宝典

一. Java基础部分 二. 算法与编程 四. Java web部分 五. 数据库部分 六. XML部分 七. 流行的框架与新技术 八. 软件工程与设计模式 九. j2ee部分 十. EBJ部分 十一. webservice部分 十二. Linux 十三.问得稀里糊涂的题

2014-12-04

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除