关于hive的安装请参考网上其他文章如:https://blog.csdn.net/Lee20093905/article/details/78871336,https://blog.csdn.net/vpqtxzmzezeqjj9977/article/details/80483019,https://www.cnblogs.com/jchubby/p/5449350.html,https://blog.csdn.net/pengjunlee/article/details/81607890,https://blog.csdn.net/Dax1n/article/details/58284201,https://blog.csdn.net/zhongqi2513/article/details/69388072
hive下载https://archive.apache.org/dist/hive/hive-2.3.4/
hive集成在hadoop 必须先安装hadoop并能够成功运行hadoop
在hadoop集群中,hive只用部署在一台节点也可以是master上即可。
hive通过执行sql命令,即可通知hadoop进行mapreduce,最终结果还是存储在hdfs上。
若启动./bin/hive 命令行后,无法进行sql命令,可能是没有启动Hive 的 Metastore Server服务进程,执行如下命令:
./hive --service metastore &
hive 必须使用其他数据库(如mysql)存储元数据,数据库中并不存储真正的数据,只存储表结构,及表对应的真正的数据结构,hdfs位置等等,真正的表对应的文件数据存储在hdfs上,如用hive创建一个表,必须指明表中字段在文件中每一行的分隔符。具体可以参考下面:
hive安装后,需要先初始化一下mysql,会自动创建几十张表,这几十张表就是元数据表