HiveOnSpark简介
Hive On Spark (跟hive没太大的关系,就是使用了hive的标准(HQL, 元数据库、UDF、序列化、反序列化机制))Hive原来的计算模型是MR,有点慢(将中间结果写入到HDFS中)Hive On Spark 使用RDD(DataFrame),然后运行在spark 集群上,hive on spark 使用的仅仅是hive的标准,规范,不需要有hive数据库一样可行。
HiveOnSpark配置
要想使用hive的标准,需要把hive的配置文件hive-site.xml放到spark的conf目录下