Hive数据操作

更多信息https://blue-shadow.top/

附书代码Github工程:https://github.com/Shadow-Hunter-X

管理表中装载数据

使用LOAD命令装载数据,分别可以从本地和HDFS上进行上传。

使用的命令分别是 LOAD DATA LOCAL INPATH ‘file://local_path’
LOAD DATA INPATH ‘HDFS://hdfs_path’

在本地文件是数据导入到Hive表中,使用 AdventureWorks下的DimAccount表说明,创建数据库和对应的表

CREATE - DB
create-db

LOAD DATA LOCAL 加载数据 , 从本地路径 (相关脚本可以在对应的github项目中下载)

load data

LOAD DATA 加载数据 , 从HDFS上 (相关脚本可以在对应的github项目中下载)

load data

通过查询向表中插入数据

* 首先创建一张和 FactInternetSales一样的表,但其为分区表(以orderdatekey作为分区列,其范围20101229-20140128): *

partition

单次查询,插入到分区表中(相关脚本可以在对应的github项目中下载)

insert_partion

多次查询,插入到分区表中(相关脚本可以在对应的github项目中下载)

mul_insert

动态插入到分区表中(相关脚本可以在对应的github项目中下载)
对于动态分区功能默认情况下没有开启。开启后以"严格"模式执行,在这种模式下要求至少有一列分区字段是静态的,这有助于阻止因设计错误导致查询产生
大量分区。

mul_partion_insert

单查询创建和加载数据

使用语句 : CREATE TABLE TABLE_NAME AS SELECT ........ 

create_insert

导出数据

如果数据文件恰好是用户需要的格式,那只需要简单拷贝文件夹或文件即可。

hdfs dfs -get  HDFS://path  file://path
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值