1.什么是hive
Hive-介绍
官网:http://hive.apache.org/
1.1 ApacheHive是数据仓库工具可以使用sql语句方便的读取,写入和管理驻留在分布式存储的中的大型数据集,结构可以投影到已经存储的数据上,提供一个命令行工具和JDBC驱动程序,将用户连接到hive。
下载
下载:http://mirrors.ustc.edu.cn/apache/hive/hive-3.1.2/
目录介绍:
Bin:可执行文件
Binary-package-licenses:二进制包的许可证
Conf:配置文件
Examples:示例代码
Hcatalog:hcata的日志;
Jdbc:java data base connection
Lib:jar包
Scripts:脚本;(vb,js);
Readme:读我;
1.2 Hive的三种模式
本地模式:此模式连接到一个In-Memory的数据库Derby,一般用于UnitTest.