Python锦集
文章平均质量分 61
私奔到月球2023
海到无边天作岸,山登绝顶我为峰。
展开
-
以集群方式运行pyspark
一、背景说明 单机执行pyspark(python on spark)非常简单,只要在脚本所在服务器上部署个python环境或Anaconda这种集成运行环境,再通过python3命令执行就完了。 而想将python提交到spark集群中运行,则有两种方法,一种是在每个spark结点上部署python环境,在spark低版本与python集成没那么完善的时候,集群结点数又不多的情况下,的确可以这么干(实际上我就这么干过),这种方式比较大的优势是每次执行pyspark任务时,不用分发python环原创 2022-05-21 11:22:32 · 2698 阅读 · 2 评论 -
python扫描mysql库列表,并生成jdbc连接
扫描一批mysql实例(登记在instance.csv文件中),并且按指定csv格式输出该实例中所有db的信息原创 2022-03-03 18:30:00 · 1119 阅读 · 0 评论 -
Python3实现Excel两个Sheet的全连接
背景现有一个Excel的两个Sheet表,需要对其进行全连接合并。对标的mysql语句是:(SELECT * from a left JOIN b on a.name=b.id) UNION (SELECT * from a RIGHT JOIN b on a.name=b.id );表结构说明Sheet1表名为exp,共4个字段,分别是包名、应用名、异常时间和异常次数 Sheet2表名为startup,共4个字段,分别是包名、应用名、启动时间和启动次数 输出Sheet表名为out原创 2022-01-24 12:03:09 · 2519 阅读 · 0 评论