Hive(一)

1、什么是hive

1、什么是`hive`

hive 基于hadoop 分布式文件系统hdfs 开发的一个ETL(从数据源抽取Extract,并清洗交互转换Transform到加载Load目的端的一个过程) 和 数据仓储工具。hive 很容易执行很多操作

1.1、hive 特点
  • hive 中首先建立数据库和表,然后再导入数据
  • hive 被设计用来管理和查询存储在表中的结构化数据
  • hive 使得用户脱离了复杂map reduce的编写,每条sql查询会被翻译成map reduce
  • hive 提供的sql叫做hsql
  • hive支持四种类型的文件:TEXTFILE, SEQUENCEFILE, ORC and RCFILE (Record Columnar File)
2、hive 结构

这里写图片描述

  • hive clients:提供不同的驱动给应用,便于和hive server交互
  • hive server:所有查询都需要经过hive server
  • Hive Storage and Computing:
    这里写图片描述
3、hive 模式
  • 本地模式:适用于只含一个datanode,数据很小
$ hive
$ hive> SET mapred.job.tracker=local;
  • map reduce模式:多节点datanode、数据分布在不同节点上
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值