2016年01月_Simple_Zz

05月 04月 01月

原创 MapReduce 工作原理简介

在MapReduce整个过程可以概括为以下过程：输入 → map → shuffle → reduce → 输出输入文件会被切分成多个块，每一块都有一个map taskmap阶段的输出结果会先写到内存缓冲区，然后由缓冲区写到磁盘上。默认的缓冲区大小是100M，溢出的百分比是0.8，也就是说当缓冲区中达到80M的时候就会往磁盘上写。如果map计算完成后的中间结果没有达...

2016-01-05 11:47:55 930

Join 查找操作的基本原则：应该将条目少的表/子查询放在 Join 操作符的左边。原因是在 Join 操作的 Reduce 阶段，位于 Join 操作符左边的表的内容会被加载进内存，将条目少的表放在左边，可以有效减少发生内存溢出错误的几率。 Join 查找操作中如果存在多个 join，且所有参与 join 的表中其参与 join 的 key 都相同，则会将所有的 join 合并到一个 mapred 程序中。

2019-07-01

分布式一致性原理与实践

介绍了几种分布式协议，重点讲解Zookeeper高可用服务搭建。

2018-09-02

阿里Java开发规范

2017年10月14日杭州云栖大会，Java代码规约扫描插件全球首发仪式正式启动，规范正式以插件形式公开走向业界，引领Java语言的规范之路。目前，插件已在云效公有云产品中集成，立即体验！（云效>公有云>设置->测试服务->阿里巴巴Java代码规约）。

2018-09-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Simple 专栏

原创 MapReduce 工作原理简介

Hive优化.docx

分布式一致性原理与实践

阿里Java开发规范

空空如也