- 博客(4)
- 资源 (21)
- 问答 (1)
- 收藏
- 关注
原创 hive调优
Hive数据倾斜解决方法总结 数据倾斜是进行大数据计算时最经常遇到的问题之一。当我们在执行HiveQL或者运行MapReduce作业时候,如果遇到一直卡在map100%,reduce99%一般就是遇到了数据倾斜的问题。数据倾斜其实是进行分布式计算的时候,某些节点的计算能力比较强或者需要计算的数据比较少,早早执行完了,某些节点计算的能力较差或者由于此节点需要计算的数据比较多,导致出现其他节点的red...
2020-02-21 11:18:56 258
原创 eclipse快捷键
【Ct rl+T】 搜索当前接口的实现类 【ALT +/】 此快捷键为用户编辑的好帮手,能为用户提供内容的辅助,不要为记不全方法和属性名称犯愁,当记不全类、方法和属性的名字时,多体验一下【ALT +/】快捷键带来的好处吧。 2. 【Ct rl+O】 显示类中方法和属性的大纲,能快速定位类的方法和属性,在查找Bug时非常有用。 3. 【Ct rl+/】 快速添加注释,能为光标所在行或所选定行快速添...
2020-02-21 11:02:34 109
原创 greenplum
Shared-Nothing Architecture MPP(Mussively Parallel Processing) 海量并行处理 基于postgreSQL8.2,增加并行处理,支持数据仓库,bi的特性 客户端支持:psql,pgadmin3,odbc,jdbc,perl,python private computing cloud 超大规模:理论上支持10000以上节点 虚拟化:主流虚拟...
2020-02-21 10:59:27 461
原创 linux系统配置
file /sbin/init uname -a df -h du -ms du -mx yum list |wc -l yum list |grep impala 修改linux启动模式,3是命令窗口启动,5是图形界面启动 vi /etc/inittab id:5:initdefault: 修改ip 1.system/networkconnections/ech* 修改 2. vi /etc/...
2020-02-21 10:54:33 156
有谁了解过TPC-DS.求大神指点
2014-12-24
TA创建的收藏夹 TA关注的收藏夹
TA关注的人