之前爬虫都使用原始的方法,或者用selenium自动化,首次接触scrapy框架,用时2天磕磕绊绊完成了数据爬取到入库,浅记录一下。
目标是完成每日仓单数据的抓取,并插入mysql数据库。
一、scrapy项目的创建
1、先安装scrapy,打开终端使用pip install scrapy即可
2、创建scrapy项目:在终端要创建的目录下,输入:scrapy startproject myProject(项目名)
此时会在当前目录下生成一个myProject的文件夹
打开myProject文件夹
3、进入此文件夹cd myProject后,通过scrapy genspider myspider(程序名) www.first_spider.com(域名?)生成蜘蛛程序。
4、此时再通过pycharm打开此myProject工程