(2021-04-20)为什么要替换 Hive 的默认数据库 Derby 为 MySQL
- Hive 使用 Derby 数据库只支持单会话模式。
Caused by: ERROR XSDB6: Another instance of Derby may have already booted the database /opt/module/hive/metastore_db
- Hive 使用 MySQL 数据库可以轻松地看到 metastore 信息。
(2021-04-22)Hive 的分区表
(2021-05-12)内部表和外部表的区别
| 应用场景 | 是否删除元数据 | 是否删除原始数据 |
---|
内部表 | 临时使用的表 | 是 | 是 |
外部表 | 绝大多数表 | 是 | 否 |
(2021-06-03)Hive 和传统关系型数据库的对比
| Hive | MySQL |
---|
1、数据量 | 大(PB 级别) | 小(1亿级别) |
2、存储 | HDFS | 本地文件 |
3、操作 | 几乎不进行修改 | 频繁增删改查 |
4、索引 | 不支持 | 支持 |
5、执行引擎 | MapReduce | InnoDB |
(2021-06-03)Hive 和 Zookeeper 的关系
Hive 自动继承 Zookeeper,但由于 Zookeeper 需要监控各个集群的状况,因此不使用 Hive 自带的 Zookeeper。