Hive-数据仓库

 

  • 交互方式-用户接口:CLI(linux命令行)、WUI(hive web页面)、Client(连接远程服务HiveServer2,eg:JDBC、ODBC)

Hive命令行模式:

1、进入bin 执行./hiv

2、配置Hive环境变量,直接执行命令:hive --service cli 或 hive

Hive的web模式:

执行hive -service hwi 启动后访问http://master:9999/hwi

Hive的远程服务:

默认端口:10000,执行启动命令:nobup hive --service hiveserver2 &

  • 元数据存储:hive是将元数据存储在mysql或者Derby等,元数据主要依赖MetastoreDB服务

hive数据模型包括表、外部表、分区、桶

  • 解析器、编译器、优化器:完成HQL语法解析,由MapReduce执行
  • 数据存储:存储在HDFS中
  • HiveQL:用于分析处理存储在HDFS中的结构化数据,它不支持事务及更新操作,延迟比较大

数据库操作:创建内表、创建外表(external关键字,删除表只删除了元数据信息,不删数据)、 创建静态分区表、创建动态分区表、创建带有数据的表 (create table xx as select xx from table)

数据导入:本地与HDFS导入、单表插入、多表插入

数据导出:导出数据到本地及HDFS

HiveQL查询:兼容大部分sql语法,不支持更新和事务

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值