大数据计算可以把数据保存在hive上,无论你用的是Core还是Sql
第一个方法是数据落到hdfs上先,之后hive去load,操作上分两步不是首选。
方法二是数据直接写到hive的表数据存储路径下,hive读取数据的时候直接反序列化了,但是这种方法只限于hive表数据格式为默认的text
方法三使用sparksql模块我们可以对一个sql数据集执行insert的语句保存到hive中,core模块的时候我们可以使用数据集的writeAPI,用jdbc的方式写入数据,或者是foreachrdd,可以先看看怎么用jdbc操作hive