Hadoop
文章平均质量分 76
胜利在即
这个作者很懒,什么都没留下…
展开
-
Hadoop学习笔记
1、Hadoop主要发行版本主流的Hadoo生态圈除了Apache Hadoop外,还有Cloudera、HortonWorks、MapR三个不同版本。1)Cloudera Distribution for Hadoop(CDH)优点:提供了包含大量包括组件和特性的用户友好界面缺点:性能不是很好,速度较慢2)Hortonworks Data Platform(HDP)优点:唯一支持Windows平...原创 2018-04-19 16:50:59 · 405 阅读 · 0 评论 -
Hive学习笔记
1、几个排序函数区别order by:对查询结果集执行一个全局排序。如果在set hive.mapred.mode=strict模式下使用order by语句,那么必须要在语句中加上limit关键字,因为执行order by的时候只能启动单个reduce,如果排序的结果集过大,那么执行时间会非常漫长。sort by :会在每个reducer中对数据进行排序,也就是执行一个局部排序过程。这可以保...原创 2018-04-19 16:51:58 · 565 阅读 · 0 评论