- 博客(4)
- 资源 (5)
- 收藏
- 关注
转载 awk简单教程
第一个 awk 让我们继续,开始使用 awk,以了解其工作原理。在命令行中输入以下命令: $ awk '{ print }' /etc/passwd 您将会见到 /etc/passwd 文件的内容出现在眼前。现在,解释 awk 做了些什么。调用 awk 时,我们指定 /etc/passwd 作为输入文件。执行 awk 时,它依次对 /etc/passwd 中的每一行执行 print 命令
2012-07-25 14:20:09 500
转载 数据倾斜总结
转载:http://blog.csdn.net/lovingprince/article/details/7264549 几个比较特殊的点都提到了,大家可以作为参考。 在做Shuffle阶段的优化过程中,遇到了数据倾斜的问题,造成了对一些情况下优化效果不明显。主要是因为在Job完成后的所得到的Counters是整个Job的总和,优化是基于这些Counters得出的平均值,而由于
2012-07-23 17:44:08 494
转载 基于MySQL和Infobright的数据仓库技术
除非你最近在一个荒岛上,否则你不可能不知道,数据仓库/分析/商务智能( BI )领域正在飞速发展。许多年前,当行业分析师群体调查CIO最优先考虑的事时,BI排第十位 。然而,他于2006年跃升到了第二位,今天,根据Gartner Group分析已经跃居第一位了。这没有什么神秘的原因:在激烈的经济竞争中所有行业和智能企业需要利用其内部的数据来做出重要的商业决策,包括战术和战略两方面,以保持行业的领先
2012-07-18 11:12:33 1397
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人