部署scrapy爬虫到AWS Ubuntu 18.04,用crontab定时执行

本文介绍了如何把windows下面的scrapy脚本部署到AWS Ubuntu上,并使用crontab定时执行。申请AWS EC2 Ubuntu虚拟机首先安装Minicondahttps://docs.conda.io/en/latest/miniconda.html然后按装scrapyconda install scrapy安装MSSQL Driver不要看网上乱七八糟的文章,直...
摘要由CSDN通过智能技术生成

本文介绍了如何把windows下面的scrapy脚本部署到AWS Ubuntu上,并使用crontab定时执行。

我的scrapy爬虫原来部署在windows服务器,爬虫每个小时从几个字幕网站爬字幕。字幕文件(即文本文件保)存在本地,但是字幕的metadata保存在Azure Database上。除了python爬虫,我还有一个.net程序复制处理爬虫获取的数据。

申请AWS EC2 Ubuntu虚拟机

AWS不用翻墙就能使用,而且提供免费虚拟机。申请的时候,只需要注意Security Group就行了。
我申请的是Ubuntu Server 18.04
在这里插入图片描述

Security Group
Inbound使用默认值,即SSH-TCP-22。
Inbound使用默认值,即SSH-TCP-22
Outbound我加上了HTTP,HTTPS和MSSQL。
Outbound我加上了HTTP,HTTPS和MSSQL

安装各种软件

首先安装Miniconda
https://docs.conda.io/en/latest/miniconda.html

安装以后修改PATH

export PATH=~/anaconda3/bin:$PATH

然后推出exit,并重新连接。

然后安装scrapy

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

织网者Eric

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值