在python中使用spark用sql语句查询mysql数据

最新推荐文章于 2024-04-15 01:39:20 发布

木木木木木林

最新推荐文章于 2024-04-15 01:39:20 发布

阅读量297

点赞数 1

文章标签： spark sql mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64005688/article/details/134272738

版权

导包，这里我导了很多，因为我其他东西要用，光连接查询只需要两个包

import math
from pyspark import SparkConf
from pyspark.sql import SparkSession
import traceback
import os
from math import sqrt
from pyspark.sql import Row
import pandas as pd
# spark_home 的环境变量
from pyspark.sql.functions import isnull, isnan
from pyspark.sql.functions import expr

一些设置

appname = "test" # 任务名称
master = "local" # 单机模式设置

创建sparkSession

这里的连接数据库的jar包每个人的位置不同

conf = SparkConf().setAppName(appname).setMaster(master) # spark资源配置
spark = SparkSession.builder.config(conf=conf)\
.config('spark.driver.extraClassPath', '/usr/local/apache-hive-2.3.9-bin/lib/mysql-connector-java-5.1.49.jar') \
.getOrCreate()

连接mysql 数据库

这里的employee和salaries是我自己数据库里面的表，每个人的mysql配置不一样，每个人的用户和密码要修改

employee = spark.read.jdbc('jdbc:mysql://localhost:3306/employee?user=root&password=123&serverTimezone=UTC&useSSL=false', table='employees')
salaries = spark.read.jdbc('jdbc:mysql://localhost:3306/employee?user=root&password=123&serverTimezone=UTC&useSSL=false', table='salaries')

查询方法

在Spark中，registerTempTable方法是DataFrame或Dataset API的一个方法，用于将一个DataFrame注册为一个临时表，以便可以使用SQL查询语句对其进行查询。

这里就相当于查employee中的前10条数据

employee.registerTempTable("emp_tbl")
result = spark.sql('SELECT * FROM emp_tbl limit 10')
result.show()
#等价于employee.select("*").limit(10)

查询结果：

木木木木木林

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
在python中使用spark用sql语句查询mysql数据

在python中使用spark用sql语句查询mysql数据
复制链接

扫一扫

木木木木木林 CSDN认证博客专家 CSDN认证企业博客

码龄3年

21: 原创

130万+: 周排名

9万+: 总排名

9146: 访问

: 等级

340: 积分

57: 粉丝

86: 获赞

5: 评论

71: 收藏

私信

关注

热门文章

分类专栏

python学习 1篇
java学习 3篇

最新评论

怎么理解java中的库和依赖？
CSDN-Ada助手: 恭喜您写了这么有深度的一篇博客！对于库和依赖的理解，您解释的非常清楚易懂。希望您可以继续分享关于Java编程的知识，也许可以写一些案例分析或者实践经验，让读者更加深入地理解这些概念。期待您的下一篇作品！
Spring是什么？怎么理解Spring
CSDN-Ada助手: 恭喜你写了第16篇博客！看了你的文章，对于Spring有了更深入的理解，写得很清晰易懂。不过我觉得你可以尝试从实际项目中提炼一些经验分享，让读者更容易将理论知识应用到实践中。期待你的下一篇文章！加油！
Java中类的定义和使用
CSDN-Ada助手: 恭喜您写了第14篇博客！在“Java中类的定义和使用”这个主题上，您的文章写得非常好，深入浅出，让人易于理解。希望您能继续坚持创作，不断分享有价值的知识。下一步，可以考虑结合实际案例，或者深入探讨一些高级的Java编程技巧，这样可以让读者受益更多。期待您更多精彩的作品！
反射，XML文档解析，常见设计模式
CSDN-Ada助手: 恭喜您发布了第15篇博客！反射，XML文档解析，常见设计模式是非常有深度的主题，您的文章内容丰富、观点独特，让读者受益匪浅。希望您能继续保持创作的热情和努力，同时也建议您可以尝试探讨一些新的技术趋势或者深入研究某个具体的设计模式，以便给读者带来更多的启发和帮助。期待您的下一篇精彩作品！愿您的博客越来越受欢迎！
本机kettle连接ubantu的hive
CSDN-Ada助手: 恭喜您写了第13篇博客！连接本机kettle到ubantu的hive是一个很有挑战性的话题，您的经验分享对很多读者来说一定非常有帮助。希望您能继续坚持创作，不断分享您的经验和见解。下一步，我建议您可以考虑分享一些更深入的技术细节或者是一些实战经验，这样可以让读者更加深入地了解相关知识。期待您更多的精彩内容！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。