如何使用hive实现对数据库的操作
1.准备工作
(1)准备数据仓库:
因为hive的数据是需要保存到hdfs上的,回去读hdfs的默认路径,这里需要自己创建了一些目录。
(注意:在hadoop目录下创建,并且要开启4个进程)
完成之后到webUI查看:
(2)准备数据:
- 将数据文件上传到linux中:
一般存放在opt/datas目录下。 - 将文件上传到hdfs中:
bin/hdfs dfs -put 文件路径(linux) 存放路径(hdfs)。
(3)创建数据库和表格:
注意:在执行sql语句前:添加下面一行命令,可让hive不去MapReduce理智型,加快运行速度。
set hive.exec.mode.local.auto=true;
- 数据库名:db_hive;