005-hive概述,计算原理及模型

计算原理及模型

  

  优化的根本思想:

    尽早尽量过滤数据,减少每个阶段的数据量

    减少job数

    解决数据倾斜问题

Hive概述

名称   
hive系统架构metastorederby
mysql
 
HDFS/usr/hive/warehouse 
Mapreduce  
hive配置文件hive-env.sh
hive-site.xml
hive-log4j.properties
  
hive命令行hive --config  
hive shellquit、exit
reset
set
add、list、delete FILES
!<command>
dfs<command>
HQL
source files
 
hive servicehive --service cli
hive --service hiveserver
hive --service metastore
hive --service hwi
hive --service jar
 
HiveQL语法关键字show databases
show PARTITIONS
show tables
create table
load data(local) inpath
select * from 
desc、alert/drop
limit、as、case when then、union
like、group by、having
order by、sort by
cluster by
 
数据类型简单类型tinyint、smallint、int、bigint
float、double
boolean
string
timestamp
binary
 复杂类型array
map
struct
内部表 
 外部表HDFS
HBase
Cassandra
DynamoDB
表查询单表查询
inner joins
outer joins
Semi joins
map joins
子查询
视图
 
数据表设计每日一表
每日一表分区
按桶分散数据
  
Hive优化表分区Partitions
表存储桶buckets
表压缩
索引→bitmap indexes
执行计划
控制Mappers、reducer数量
  
访问方式Hive shell
java jdbc api
thrift client
Rhive
  
自定义函数自定义函数UDF
自定义聚合函数UADF
  
Hive安全认证hive.files.umask.value
hive.metastore.authorization.storage.checks
hive.metastore.execute.setugi
 
授权hive.security.authorization.enabled
hive.security.authorization.createtable.owner.grants
hive.security.authorization.createtable.user.grants
 
权限模型User
Group
Role
 
web控制台hwi:9999  
软件集成zookeeper
thrift
Ooize
HCatalog
AWS
  

 

图解示例

HIve-mapreduce

 

转载于:https://www.cnblogs.com/bjlhx/p/6945964.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值