自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

A coder of life

记录bug人生

12月 11月 09月 08月 07月 05月 03月 02月 01月

原创 hive学习之三:项目中的hive优化实践

1.小表放入内存，在map端join，并不是所有聚合操作都在reducer端操作,慎重使用mapjoin,一般行数小于2000行，大小小于1M2.hive.groupby.skewindata变量从上面groupby语句可以看出，这个变量是用于控制负载均衡的。当数据出现倾斜时，如果该变量设置为true，那么Hive会自动进行负载均衡。当该变量设为 true时候，不可以使用distinct

2016-05-17 21:37:49 1362

原创 hive学习之二：hive sql使用总结及遇到的问题

1.hive在连接中不支持不等值连接，不支持or，where条件后不支持子查询。分别举例如下及实现解决办法。 1.1.不支持不等值连接错误:select * from a inner join b on a.id 替代方法:select * from a inner join b on a.id=b.id and a.id is null; 1.2.不

2016-05-12 09:06:31 17319

Hive权限设置说明

CDH平台，通过hue访问hive，控制库级别，表级别，及列级别的访问权限

2018-07-17

大数据开发工具包-项目构建工具-maven3.5.4

Apache maven3.5.4的版本，项目构建必备工具之一，功能强大。

2018-07-04

大数据开发工具包-版本控制工具-Windows版64位git

版本控制工具git，不同于传统的SVN，git的使用越来越广泛。

2018-07-04

大数据开发工具包-插件工具-IDEA2017.3.5的scala插件

此scala插件对应idea的版本是2017.3.5版本，安装简单。

2018-07-04

大数据开发工具包-文本编辑工具-notepad++

notepad++编辑器可编辑各类文本，包括shell，SQL，txt等等....

2018-07-04

大数据开发工具包-服务器连接工具-XShell

方便好用的连接服务器的工具，必备的大数据服务器连接工具之一。

2018-07-04

nginx_upstream_check_module

nginx后端节点健康检查模块插件，非常好用，淘宝开发。

2016-11-12

pcre-8.39.tar.gz

安装nginx所依赖的包，如果安装了，不用再安装。

2016-11-12

nginx-1.11.5.tar.gz

一款非常流行的负载均衡工具，配置简单易用，功能强大，搭配keepalived做高可用。

2016-11-12

protoc-2.5.0-win32.zip

protobuf 谷歌的轻量级数据交换格式，该工具可以方便的产生java，c等类。

2016-08-30

yarn-utils.py

根据集群计算内存分配，使用前确定已安装pyhon，使用方法（linux环境）： python yarn-utils.py -c 32 -m 128 -d 7 -k False -c：核数 -m：内存大小 -d：磁盘数 -k：hbase是否安装。False-没有安装 True-安装

2016-02-25

hbase shell常用命令汇总

总结常用的hbase shell操作命令。

2016-02-15

Python-3.5.1.exe

可执行文件，在windows环境下双击直接执行.

2016-01-12

json相关6个jar包

json解析所需要的几个jar包，总共六个。需要的下载。

2016-01-05

反编译工具jd-gui.exe

很好用的反编译工具，直接用这个工具打开jar包就可以查看源代码了。

2016-01-02

sqldbx数据库连接工具

数据库连接工具，很好用。写sql有提示，速度也挺快。

2016-01-02

mysql-connector-java-5.1.6-bin.jar

Java连接mysql数据的jar包，亲测可用。

2016-01-02

impala快速入门手册

指导新手快速使用impala做数据分析工作。包括常用的命令行和性能优化方法。

2016-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除