- 博客(7)
- 收藏
- 关注
转载 HIVE使用及优化
目录: 1.hive介绍 2.Mapreduce过程详解 3.hive常用优化及问题详解 4.hive常用参数1.HIVE介绍 --源自百度百科https://baike.baidu.com/item/hive/67986?fr=aladdinHive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存...
2018-06-13 16:14:29 196
转载 linux用户切换
(1)从user用户切换到root用户不管是用图形模式登录Ubuntu,还是命令行模式登录,我们会发现缺省的用户是user但是当我们需要执行一些具有root权限的操作(如修还系统文件)时,经常需要用sudo授权,感觉很麻烦此时我们可以切换到root用户,只需要简单的执行sudo su 即可注意: 出于安全考虑,默认时Ubuntu的root用户时没有固定密码的,它的密
2017-09-08 10:47:01 354
转载 HIVE动态分区和动态导入
需求场景:hive计算完成导入oracle以后由于结果表需要重建,需要把hive中保存的分区信息同步到另外一张hive表对应的分区中,就涉及到多分区同时插入,下面介绍方法。Hive中是支持分区的。关系型数据库(如Oracle)中,对分区表Insert数据时候,数据库自动会根据分区字段的值,将数据插入到相应的分区中,Hive中也提供了类似的机制,即动态分区(Dynamic Parti
2017-04-19 11:00:24 1603
原创 开通新博客,希望多多关注
1.新的一年开始维护博客计划,主要关注以下几部分内容1.数据仓库,大数据hadoop,hive,spark等领域2.关注数据库,深入了解oracle数据库机制,以及熟悉mysql数据库。3.熟练linux,以及Java部分的内容。R,SASS等分析建模工具。4.定期撰写数据分析文档。希望多多 关注
2016-12-26 11:12:31 199
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人