![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
Ashley_JIANG
这个作者很懒,什么都没留下…
展开
-
面试题汇总
spark reduceByKey和groupByKey的区别 reduceByKey可以自定义函数,groupByKey不可以自定义函数 reduceByKey可以在shuffle之前将输出数据与一个共用的key结合,先在本地进行merge操作,减少了很多不必要的数据进行数据传输造成的IO reduceByKey更适合大数据上的操作2. spark和hadoop的区别3. hive中的mapjoin原理hive中join的方式有两种MapJoin和ReduceJoin.原创 2021-03-28 20:17:15 · 139 阅读 · 0 评论 -
hive表新增字段或者修改字段
1. hive表操作1. 修改表字段的数据类型或者修改表字段名字#如果表是外部表,需要先修改为内部表alter table 数据库名.表名set tblproperties('EXTERNAL' = 'FALSE');ALTER TABLE 数据库名.表名 CHANGE COLUMN 字段名 新的字段名(如果不变就保持原字段) 字段类型(若不变就采用原来的字段) COMMENT '新的字段备注';alter table 数据库名.表名set tblproperties('EXTERNAL原创 2020-12-09 15:52:27 · 26493 阅读 · 1 评论