根据业务需求,需要对Amazon电商平台中某个店铺下所有的SKU信息进行监控,数据更新周期为每天。
所使用的爬虫框架为scrapy,大致任务是从数据库中获取当前店铺的所有产品的ASIN,随后进行拼接产品url,爬取主要内容为产品星级、Rating数量、Reviews数量、大类排名及小类排名等。
自动化爬虫搭建步骤:
1.在爬虫脚本目录下构建autorun.bat,用于后续启动爬虫脚本,scrapy crawl 后面跟着的是spider文件里的name的值
![scrapy crawl 后面跟着的是spider文件里的name的值](https://i-blog.csdnimg.cn/blog_migrate/975be2594c7d4bade920e6a64db3cb07.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/398ec05566306c6c6ebd67b58be664a9.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/1cc550ed8771a4e0e35893c4f6e968c1.png)
2.按下Win+R,并且输入taskschd.msc,进入Windows系统中的任务计划程序
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/7d8c5d6ebf830f2c6d3a92f57a5c828f.png)
3.点击创建基本任务,输入基本任务名