部署scrapy爬虫到AWS Ubuntu 18.04,用crontab定时执行

本文详细阐述了如何将Windows下的Scrapy爬虫部署到AWS Ubuntu 18.04服务器,并利用crontab进行定时执行。首先,介绍了申请AWS EC2 Ubuntu虚拟机的过程,包括设置Security Group。接着,讲解了安装Miniconda、Scrapy、MSSQL驱动等软件的步骤。然后,通过SCP将文件复制到Ubuntu服务器,并配置crontab以每小时运行一次爬虫。最后,讨论了crontab的使用和日志记录的方法。
摘要由CSDN通过智能技术生成

本文介绍了如何把windows下面的scrapy脚本部署到AWS Ubuntu上,并使用crontab定时执行。

我的scrapy爬虫原来部署在windows服务器,爬虫每个小时从几个字幕网站爬字幕。字幕文件(即文本文件保)存在本地,但是字幕的metadata保存在Azure Database上。除了python爬虫,我还有一个.net程序复制处理爬虫获取的数据。

申请AWS EC2 Ubuntu虚拟机

AWS不用翻墙就能使用,而且提供免费虚拟机。申请的时候,只需要注意Security Group就行了。
我申请的是Ubuntu Server 18.04
在这里插入图片描述

Security Group
Inbound使用默认值,即SSH-TCP-22。
Inbound使用默认值,即SSH-TCP-22
Outbound我加上了HTTP,HTTPS和MSSQL。
Outbound我加上了HTTP,HTTPS和MSSQL

安装各种软件

首先安装Miniconda
https://docs.conda.io/en/latest/miniconda.html

安装以后修改PATH

export PATH=~/anaconda3/bin:$PATH

然后推出exit,并重新连接。

然后安装scrapy

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

织网者Eric

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值