Ubuntu利用crontab定期執行scrapy spider

Ubuntu利用crontab定期執行scrapy spider

安裝scrapy

pip3 install scrapy #安裝scrapy

並將scrapy安裝在虛擬環境中,避免package之間互相排擠

scrapy爬蟲 & shell撰寫

在專案資料夾中執行:

scrapy crawl your_project_name # 開始執行

確認以上爬蟲和以下執行shell都可以正常運作之後

#!/bin/bash
 
cd /home/xxx/project #你的爬蟲目錄
 
scrapy crawl myspider #執行scrapy
sh /xxx/xxx/xx.sh    #執行shell

開始加入crontab進行排程,會發現爬蟲無法正常運作。因為crontab不知道scrapy的路徑,因此須找出scrapy的路徑,並在原先腳本中的scrapy crawl myspider前加上

whereis scrapy  # 查找scrapy路徑
#!/bin/bash 
#我的最終shell
source scrapy/bin/activate # 啟動虛擬環境
 
cd /home/xxx/project #返回我的爬蟲目錄
 
/home/ubuntu/scrapy/bin/scrapy crawl myspider #在這裡加上scrapy路徑

deactivate # 結束虛擬環境

crontab排程

crontab -e # 寫新的process
## ubuntu shell的路徑是用/bin/bash
## 標明project的絕對路徑
0 22 * * * /bin/bash /home/ubuntu/xxx/project  # 每天晚上十點執行一次

相關crontab撰寫可參考: crontab guru

參考資料

ubuntu打开crontab日志及不执行常见原因 >>這篇真的很推薦閱讀!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值