spark + psycopg2+postgre 实现insert update 功能

最新推荐文章于 2022-08-04 15:01:23 发布

miniseax

最新推荐文章于 2022-08-04 15:01:23 发布

阅读量1.2k

点赞数 2

分类专栏：大数据

本文链接：https://blog.csdn.net/wugcd/article/details/78527475

版权

spark sql 主要是想了select 功能，不具备insert, update 功能，本文实现用spark + psycopg2对postgre 数据库进行insert update计算，代码部分已进行了详细的说明:

import psycopg2
import psycopg2.extras

from pyspark import SparkContext,SparkConf
from pyspark.sql import SQLContext
from pyspark.sql.types import Row, StructField, StructType, StringType, IntegerType

#opera: 对rdd中每一条记录进行操作
def opera(x):
newval = x[2]+ x[3]
return Row(id=x[0], name=x[1], val=newval)

#save_df_to_db:对rdd中的每一个partition进行处理
def save_df_to_db(records):

db_conn = psycopg2.connect(database="testdb", user="postgres", password="password", host="127.0.0.1", port="5432")
dict_cursor=db_conn.cursor()
upsert_query = "INSERT INTO t3 (id, name, val) VALUES (%(id)s, %(name)s, %(val)s) ON CONFLICT (

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

miniseax

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
spark + psycopg2+postgre 实现insert update 功能

spark sql 主要是想了select 功能，不具备insert, update 功能，本文实现用spark + psycopg2对postgre 数据库进行insert update计算，代码部分已进行了详细的说明:import psycopg2import psycopg2.extrasfrom pyspark import SparkContext,SparkConf
复制链接

扫一扫