![](https://img-blog.csdnimg.cn/20190918140158853.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
大数据
大数据技术栈
sunghosts
这个作者很懒,什么都没留下…
展开
-
Hive清理分区
Hive内部表和外部表1.内部表没有external 关键字2.内部表可以不指定 location关键字,当然hivesql执行外部表是也可以不指定,但是一般不这么用,sparksql,执行时不指定会报错3.内部表删除表时,直接删除元数据以及实际数据,外部表则只会删除元数据,hdfs上保留数据这一条会衍生一些东西如果建立临时表,一般使用内部表,这样可以直接删除数据,不至于导致数据多余删除外部表时,再create table ,然后insert overwrite 时,会使数据重复一倍,需要注意原创 2022-01-28 14:57:11 · 4419 阅读 · 0 评论 -
Hive——join的使用
转:https://www.cnblogs.com/jnba/p/10673747.htmlhive中常用的join有:inner join、left join 、right join 、full join、left semi join、cross join、mulitiple在hive中建立两张表,用于测试:hive> select * from rdb_a;OK1 lucy2 jack3 tony hive> select * from转载 2021-10-15 17:20:02 · 648 阅读 · 0 评论 -
Excel数据导入hive步骤
Excel导出逗号文件.csv将CSV文件导入到hive服务器制定目录转换编码格式转换编码格式,在指定目录下执行如下命令:piconv -f gb2312 -t UTF-8 CompanyCode.txt > c.txt在hive中建表create table sf_staff_info(uid string,department string,phone string)ROW format delimitedfields terminated by..转载 2021-09-17 19:07:24 · 1312 阅读 · 0 评论