Databricks 入门之连接外部数据库

连接方式应该很多,现在记录本人目前学习到的一种方式。

一、读取外部数据库

1.notebook执行语言为sql时可以通过JDBC方式加载数据库数据。

以下代码将可以将sqlserver中的表加载到databricks视图中,当然也可创建表来接收外部数据。

%sql

CREATE TEMPORARY VIEW view-name
USING JDBC
OPTIONS (
  url "jdbc:sqlserver://<your-database-url>;database=<your-database-name>,.;Authentication=<your-authentication-type>;",
  dbtable "<your-table-name>",
  user '<username>',
  password '<password>'
)

2.sql方式操作视图直接读取数据库数据

可以直接sql操作上一步的数据来直接读取数据

%sql

select * from view-name

有时候我们需要在notebook为spark的环境下加载数据,可以通过以下方式操作步骤1中建立的视图来读取数据,将数据加载到Dataframe中。

%python

data_pd = spark.sql("select * from view-name").toPandas()

二、写数据到外部数据库

1. sql方式写入

待测试更新。。。

2.spark方式写入数据库

可以通过以下方式将dataframe数据写入到数据库,url、user、password参数与上文“一”中读取数据时相同。driver为数据库驱动,比如我使用的是sqlserver,driver为

" com.microsoft.sqlserver.jdbc.SQLServerDriver"

%spark

spark.createDataFrame(data_pd).write \
                .mode("append") \
                .format("jdbc") \
                .option("url", url) \
                .option("dbtable", dbtable) \
                .option("user", user) \
                .option("password", password) \
                .option("driver", driver) \
                .save()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值