Airflow安装部署

本文档详细介绍了在Linux环境下安装Airflow的过程,包括系统环境准备、Python环境配置(使用Anaconda)、MySQL和Redis的安装,以及Airflow的安装、配置、启动。还解决了在安装过程中遇到的数据库连接警告和权限问题,提供了CeleryExecutor的配置和启动建议。
摘要由CSDN通过智能技术生成

Airflow安装部署

新闻信息是通过爬虫获取,使用scrapy框架进行爬虫任务;使用airflow工作流监控平台对爬虫任务进行管理、监控(可使用CeleryExecutor分布式,也可使用LocalExecutor多进程进行数据采集)。以下主要是对airflow的安装和配置。

1.系统环境

目前使用的系统环境为Centos Linux release 7.4.1708 (core),linux版本的内核Linux version 3.10.0-693.2.2e17.x86_64.

ip 地址:

  • 外网:47.104.191.52
  • 内网:172.31.178.92

2.准备python环境,安装Anaconda

2.1下载安装文件

下载地址1(官方网站)

下载地址2(清华开源镜像)

下载对应版本安装文件

2.2上传安装文件,开始安装

将下载的文件上传到Linux系统中 /opt

1、执行命令安装

cd /opt

sh Anaconda3-5.2.0-Linux-x86_64.sh (按回车键,直到出现>>> 输入yes)

/opt/anaconda3 (安装目录)

2、配置环境变量

echo "export PATH=/opt/anaconda3/bin:$PATH" >> /etc/profile

source /etc/profile

3.安装mysql (供airflow使用)、redis

mysql作为airflow数据库,主要是记录airflow信息;

redis作为celery的broker和backend(也可以用RabbitMQ),如果不使用CeleryExecutor则不需要redis配置。

4.安装配置airflow

  1. 通过anaconda安装虚拟环境news_push

    /opt/anaconda3/bin/conda create -y --name news_push python=3.6.5

  2. airflow安装、配置

    • 激活虚拟环境news_push

      source activate news_push

    • 通过pip安装airflow

      pip install airflow

    • 配置airflow目录(先创建/opt/NewsPush项目目录)

      echo "export AIRFLOW_HOME=/opt/NewsPush/airflow >> /etc/profile"

      source /etc/profile

    • 初始化数据库

      airflow initdb

    • 启动airflow

      airflow webserver -p 5556

      可到浏览器查看http://ip:5556/admin/

    • 配置airflow-更改数据库为mysql

      • 登录mysql

      mysq

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值