自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

pengweid专栏

12月 11月 10月 09月 06月 05月 04月 03月

原创 Shuffle过程介绍

摘要：腾讯分布式数据仓库基于开源软件Hadoop和Hive进行构建,TDW计算引擎包括两部分：MapReduce和Spark，两者内部都包含了一个重要的过程—Shuffle。本文对Shuffle过程进行解析，并对两个计算引擎的Shuffle过程进行比较。腾讯分布式数据仓库（Tencent distributed Data Warehouse, 简称TDW）基于开源软件Hadoop和Hiv...

2015-05-03 12:50:32 9214

转载 Shuffle 过程详解

Shuffle过程是MapReduce的核心，也被称为奇迹发生的地方。要想理解MapReduce， Shuffle是必须要了解的。我看过很多相关的资料，但每次看完都云里雾里的绕着，很难理清大致的逻辑，反而越搅越混。前段时间在做MapReduce job 性能调优的工作，需要深入代码研究MapReduce的运行机制，这才对Shuffle探了个究竟。考虑到之前我在看相关资料而看不懂时很恼火，所以在这里

2015-05-03 12:47:03 458

原创 java 二分查找法

public class QueryDemo { public static void main(String[] args) { int[] arr2 = new int[] { 11, 3,32,34, 45, 56, 78 }; System.out.println("67在数组中的位置:" + halfSearch(arr2, 11)); } public static

2015-05-03 10:19:14 641

原创 java 简单排序

public class SortDemo { public static void main(String[] args) { int[] arr = { 12, 3, 4, 56, 688, 9 }; bubbleSort(arr); selectSort(arr); print(arr); } // 选择 public static void selectSort

2015-05-03 10:15:23 761

转载 hbase 为什么查询比较快

第一、数据分区存储（region）通过rowkey可以快速地位到在那个region上，位置信息保存在hbase的meta表里。每次查询都会有location cache的，所以htable里面的Hconnection 初始化的时候访问速度相对来说稍慢，客户端缓存截图如下。随着数据越来越大，meta表的查询有可能遇到瓶颈，建议单独独立出成一个meta server。

2015-05-01 18:51:51 3404 1

转载避免regionServer宕机

因为regionserver 的管理信息主要记录在zookeeper，regionserver的宕机判断依据是session expired。ok那么regionserver 和Zookeeper的session expired原因有哪些尼？1. 网络不好。2. Java full GC，这会block所有的线程。如果时间比较长，也会导致session exp

2015-05-01 18:43:24 397

java11多线程编程技术终极版--王者归来签名.pdf

Java8编程核心技术_完整版.pdf

2019-06-26

阿里巴巴开发手册终极版2019.pdf

阿里巴巴Java开发手册(终极版) ----京东卖40，这里只要3积分

2019-06-26

汪文君高并发编程实战视频完整未加密

汪文君高并发编程实战视频完整未加密汪文君高并发编程实战视频完整未加密汪文君高并发编程实战视频完整未加密汪文君高并发编程实战视频完整未加密汪文君高并发编程实战视频完整未加密

2018-12-22

ealsticsearch6.2.3.zip

ealsticsearch6.2.3.zip

2018-11-06

Logstash-Elsticsearch+kibana (阿里巴巴内部实现模型).pdf

Logstash-Elsticsearch+kibana (阿里巴巴内部实现模型).pdf

2018-11-06

elasticsearch服务器开发.pdf

elasticsearch服务器开发.pdf

2018-10-20

分布式链路追踪

分布式链路追踪介绍，阿里巴巴集团发布。

2018-10-20

db2安装使用手册.doc

db2安装使用手册.doc

2016-10-03

jredis-1.0-rc2.jar

jredis-1.0-rc2.jar

2016-10-03

oracle 编程高手

oracle 编程高手

2016-09-08

SoapUI使用手册.pdf

SoapUI使用手册.pdf

2016-06-05

jxl poi jar包

通过jxl/poi 实现excel导入导出需要使用的jar包

2015-06-21

HBase权威指南

HBase权威指南

2015-03-28

java面试宝典

一. Java基础部分二. 算法与编程四. Java web部分五. 数据库部分六. XML部分七. 流行的框架与新技术八. 软件工程与设计模式九. j2ee部分十. EBJ部分十一. webservice部分十二. Linux 十三.问得稀里糊涂的题

2014-12-04

hystrix到底是如何解决雪崩的？

2018-02-25

maven如何自定义变量？

2017-07-27

maven pom如何找到其它依赖项目的路径？？？

2017-07-25

maven打包的时候怎么能把子项目的resouce资源打包进去？

2017-07-25

maven打包的时候怎么能把子项目的resouce资源打包进去？

2017-07-25

maven多模块开发，加载resource的时候？？？

2017-07-24

大神出来呀，，，，，，spring boot依靠maven实现多模块开发，但是我有一个问题？？？

2017-07-24

maven多模块开发，如果实现模块配置独立？

2017-07-24

cassandra 模糊查询怎么查？

2017-05-05

js 中的for循环怎么每循环一次睡眠3秒？？？

2016-06-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除