spark学习(8)之其他类型数据源(jdbc/hive)生成DataFrame

枣泥馅

已于 2022-12-08 10:17:20 修改

阅读量283

点赞数

分类专栏：大数据hadoop 文章标签： spark

于 2021-01-17 15:29:52 首次发布

本文链接：https://blog.csdn.net/u011447164/article/details/112734449

版权

大数据hadoop 专栏收录该内容

78 篇文章 8 订阅

订阅专栏

（3）数据源jdbc
注意：对于Oracle10来说，需要升级一下驱动，使用11g驱动
除了这一这个，启动spark-shell的时候也需要把oracle的驱动jar加载一下，具体示例如下

bin/spark-shell --master spark://bigdata111:7077 --jars /root/temp/ojdbc6.jar --driver-class-path /root/temp/ojdbc6.jar
//访问Oracle
val oracleDF = spark.read.format("jdbc").option("url","jdbc:oracle:thin:@192.168.157.135:1521:orcl").option("dbtable","scott.emp").option("user","scott").option("password","tiger").load

(4)把hive当做数据源
（*）集成Hive和Spark SQL
只需要将以下文件拷贝到$SPARK_HOME/conf的目录下，即可

$HIVE_HOME/conf/hive-site.xml
$HADOOP_CONF_DIR/core-site.xml
$HADOOP_CONF_DIR/hdfs-site.xml

（*）启动Spark Shell的时候，加载MySQL的驱动
bin/spark-shell --master spark://bigdata111:7077 --jars /root/temp/mysql-connector-java-5.1.43-bin.jar
在这里插入图片描述
上面的是我们在hive下操作的。

上面的是我们在spark-shell中操作的，是不是和在hive中操作的一样，这个就是用hive当spark的数据源，我们直接使用Spark Sql使用sql语句操作就可以了。

枣泥馅

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
spark学习(8)之其他类型数据源(jdbc/hive)生成DataFrame

（3）数据源jdbc注意：对于Oracle10来说，需要升级一下驱动，使用11g驱动除了这一这个，启动spark-shell的时候也需要把oracle的驱动jar加载一下，具体示例如下bin/spark-shell --master spark://bigdata111:7077 --jars /root/temp/ojdbc6.jar --driver-class-path /root/temp/ojdbc6.jar//访问Oracleval oracleDF = spark.read.form
复制链接

扫一扫