数据存储与数据仓库
仗剑走天涯-数海度余生
发现数据之美,用心改变世界!
展开
-
hadoop任务提速选项
mapred.map.tasks.speculative.execution=truemapred.reduce.tasks.speculative.execution=true这两个是推测执行的配置项,它们默认值是true所谓的推测执行,就是当所有task都开始运行之后,Job Tracker会统计所有任务的平均进度,如果某个task所在的task node机器配置比原创 2016-02-07 11:26:09 · 631 阅读 · 0 评论 -
hive 行转列和列转行的方法
一、行转列的使用1、问题hive如何将a b 1a b 2a b 3c d 4c d 5c d 6变为:a b 1,2,3c d 4,5,6转载 2016-03-09 11:44:44 · 3368 阅读 · 0 评论 -
产品经理最爱,数据包工具下载和反馈
数据包管理工具下载和反馈最新版本6.0当初刚进公司的时候做这个工具,纯粹是为了减少产品经理经常找过来帮忙加工下数据包,一般都要到linux上去敲几个命令搞定,但是时间久了、需求多了就忙不过来了。后来干脆用业余的时间随手写了一个windows版的简单工具,没想到在产品经理中间大受欢迎,在公司很多业务中推广开来。用的多了,问题也就来了,总会有些人在RTX/QQ上找到反馈原创 2015-11-05 15:48:25 · 2468 阅读 · 1 评论