本文参照了如下文章
看过很多文章,觉得这两篇写的比较好,故拿出来与大家分享。
本文的scrapy实在eclipse环境中运行的
1.开发环境的配置
下载eclipse之后,只需要解压即可,装好pathon插件。
2.新建项目
在cmd中,进入您打算存储代码的目录中,运行下列命令:
scrapy startproject name
其中name就是你的项目的名字,然后在eclipse中将改目录引入你的工作空间,如下我的项目根目录就是hello,我的爬虫以后就放在这个目录里面。
然后在根目录下面新建一个pathon文件,取名为main,放入如下图的代码。以后不管是项目的新建还是项目运行都可以通过运行这个文件就行了。
from scrapy import cmdline
cmdline.execute("scrapy crawl pharm".split())
# cmdline.execute("scrapy startproject drug".split())
上面第二行用来让建好的爬虫运行,第三行用来新建爬虫,根据用途就注释另一行。
scrapy startproject bbsdmoz