5-Spark使用指南
文章平均质量分 86
spark相关操作
仰望星空的小随
这个作者很懒,什么都没留下…
展开
-
airflow配置相关
airflow配置信息Airflow 1.10+安装整体流程建库、建用户Airflow安装airflow 配置1. 安装Mysql模块2. 用户认证3. 配置邮件服务4、配置Executor5. 修改log地址6. 修改webserver地址7. 可选配置8.celery配置信息9.scheduler配置信息调度程序尝试触发新任务的时间运行airflow安装问题汇总配置任务Airflow 1.10+安装本次安装Airflow版本为1.10+,其需要依赖Python和DB,本次选择的DB为Mysql。本原创 2021-10-24 14:49:14 · 1919 阅读 · 0 评论 -
spark操作dataframe
1.创建dataframe1.1读取文件来创建dataframefrom pyspark.sql import SparkSession #sparkSession为同统一入口#创建spakr对象spark = SparkSession\ .builder\ .appName('readfile')\ .getOrCreate()# 1.读取csv,parquet等文件文件logFilePath = 'births_train.csv'log_df = spark.原创 2021-08-02 15:12:13 · 2785 阅读 · 0 评论