pyspark写入mysql关于jdbc的加载方法

最新推荐文章于 2024-06-06 13:20:41 发布

qq_36329233

最新推荐文章于 2024-06-06 13:20:41 发布

阅读量2.3k

点赞数 1

分类专栏： spark

本文链接：https://blog.csdn.net/qq_36329233/article/details/100701183

版权

spark 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

from pyspark.sql import SparkSession

# Creates spark session with JDBC JAR
spark = SparkSession.builder \
    .appName('stack_overflow') \
    .config('spark.jars', '/path/to/mysql/jdbc/connector') \
    .getOrCreate()

# Creates your DataFrame with spark session with JDBC
df = spark.createDataFrame([
    (1, 'Hello'),
    (2, 'World!')
], ['Index', 'Value'])

df.write.jdbc('jdbc:mysql://localhost:3306/my_db?useSSL=false', 'my_table',
              mode='append',
              properties={'user': 'db_user', 'password': 'db_pass'})

df.write.format('jdbc').options(url='jdbc:mysql://localhost/db4recommandation',driver='com.mysql.jdbc.Driver',dbtable='user_activity',user='123',password='456',useSSL=False).mode('append').save()

两个命令：

spark-submit --jars spark-streaming-flume-assembly_2.11-2.4.4.jar test_push.py
./bin/flume-ng agent --conf conf --conf-file conf/flume-conf.properties.example_push --name a1 -Dflume.root.logger=INFO,console

分解列元素：

df:

+-----+------+
|first|second|
+-----+------+
|d,e,f| D,E,F|
+-----+------+

df.alias('L').select('L.*',F.posexplode(F.split('first',',')).alias('p1','v1')).alias('R').select('R.*',F.posexplode(F.split('second',',')).alias('p2','v2')).show()

某些小技巧：

https://stackoverflow.com/questions/39235704/split-spark-dataframe-string-column-into-multiple-columns

(有时候withcolumn不行，用https://stackoverflow.com/questions/50123238/pyspark-use-dataframe-inside-udf)

读取：

df = spark.read.format('jdbc').options(
    url='jdbc:mysql://127.0.0.1',
    dbtable='dbname.tablename',
    user='root',
    password='123456' 
    ).load()
df.show()

qq_36329233

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
pyspark写入mysql关于jdbc的加载方法

from pyspark.sql import SparkSession# Creates spark session with JDBC JARspark = SparkSession.builder \ .appName('stack_overflow') \ .config('spark.jars', '/path/to/mysql/jdbc/connector') ...
复制链接

扫一扫

专栏目录