数据仓库
liuxw0035
这个作者很懒,什么都没留下…
展开
-
开发高效的hive程序,hive优化
给部门做的一次hive开发优化的分享,经验不足,还请大家多多指教。 ppt见附件。 •分区裁剪、列裁剪•合理利用中间表,避免对一个表重复扫描•尽量避免笛卡尔积•合理使用MapJoin•用Join代替IN•合理使用Union a...2012-06-20 10:04:24 · 74 阅读 · 0 评论 -
数据分析和数据挖掘的区别
有很多初入商业智能的同学可能不明白数据分析和数据挖掘的区别在哪里,觉得他们做的事情都差不多,我亦如此! 经过这几年工作中和他们的合作和学习,大概清楚了他们的区别,今天看到一篇文章,系统的解释了下这两者的区别: 数据分析,是对数据的一种操作手段。或者算法。目标是针对先验的约束,对数据进行整理,筛选,加工。由此得到信息。数据挖掘,是对数据分析手段后的信息,进行价值化的分析。而数...原创 2012-10-30 10:45:04 · 147 阅读 · 0 评论 -
sqlserver 动态列转行
今天在sqlserver2012上遇到一个分析需求,用到动态列转行,记录一下: create table t1 (id int,value varchar(100));insert into t1 values(1,'a,b,c');insert into t1 values(2,'a,b,c,d,e');insert into t1 values(3,'a,b,c,d,e,...2014-12-23 15:26:06 · 198 阅读 · 0 评论