1.Hive的运行方式
Hive的运行模式即任务的执行环境,分为本地与集群两种,我们可以通过mapred.job.tracker 来指明,设置方式:
hive > SET mapred.job.tracker=local;
2.Hive的启动方式
- hive 命令行模式,直接输入
#/hive/bin/hive
的执行程序,或者输入
#hive --service cli
- hive web界面的 (端口号9999) 启动方式
#hive --service hwi &
用于通过浏览器来访问hive http://hadoop0:9999/hwi/
- hive 远程服务 (端口号10000) 启动方式
#hive --service hiveserver &
4.Hive的数据存储
- Hive的数据存储基于Hadoop HDFS
- Hive没有专门的数据存储格式
- 存储结构主要包括:数据库、文件、表、视图
- Hive默认可以直接加载文本文件(TextFile),还支持sequence file
创建表时,指定Hive数据的列分隔符与行分隔符,Hive即可解析数据
5.Hive的数据表
- Table 内部表
- Partition 分区表
- External Table 外部表
- Bucket Table 桶表