Spark 支持通过Java JDBC访问关系型数据库。需要通过JdbcRDD进行,示例如下:
1. 在pom.xml中添加mysql的依赖
<dependency>
<groupId>mysql</groupId>
<artifactId>mysql-connector-java</artifactId>
<version>5.1.27</version>
</dependency>
2. Mysql读取过程:
2.1 定义连接mysql的参数
val driver = "com.mysql.jdbc.Driver"
val url = "jdbc:mysql://localhost:3306/tmall_ssm"
val userName = "root"
val passWd = "admin111"
2.2 创建jdbcrdd访问数据库
查看jdbcrdd
源码,其中lowerBlowound
和upperBound
代表数据范围
class JdbcRDD[T: ClassTag](
sc: SparkContext,
getConnection: () => Connection,
sql: String,
lowerBlowound: Long,
upperBound: Long,
numPartitions: Int