Spark SQL与Hive整合成功后,可以使用以下几种方式对Hive数据仓库进行操作。
1. Spark SQL终端操作
Spark SQL终端启动后,可以直接使用HiveQL语句对Hive数据仓库进行操作。
例如,列出当前所有数据库,代码如下:
spark-sql> show databases;
default
Time taken: 3.66 seconds, Fetched 1 row(s)
可以看到,默认有一个名为default的数据库。
创建表student,其中字段id为整型,字段name为字符串,代码如下:
spark-sql> CREATE TABLE student(id INT,name STRING);
Time taken: 1.351 seconds