hive SQL
一、外部表和内部标的区别
转载https://blog.csdn.net/u012599619/article/details/50999259
二、外部表和内部表的使用场景
使用场景:
每天收集到的网站数据,需要做大量的统计数据分析,所以在数据源上可以使用外部表进行存储,方便数据的共享,在做统计分析时候用到的中间表,结果表可以使用内部表,因为这些数据不需要共享,使用内部表更为合适。
三、hive sortby 和orderby的区别
orderby会对输入数据做全局排序,只有一个reduce,数据量较大时,很慢。sortby不是全局排序,只能保证每个reduce有序,不能保证全局有序。