已经安装scrapy的跳过
1.scrapy的安装和项目的创建
安装scrapy
pip install scrapy
项目的创建
在Termianl中输入scrapy startproject 项目名字回车,然后cd 项目名字回车
创建一个爬虫文件输入scrapy genspider 文件名 地址 例如(scrapy genspider wy www.com)
2.流程
3项目实施
我们需要获取国内国际等模块的url,打开网站,按F12或者右击鼠标检查,定位到国内。我们需要获取的就是a标签下的herf的属性值。
获取各模块的url,我们可以知道所有的模块都在ul标签下,这就需要我们获取ul标签下所有的li标签,然后进行xpath解析出各个模块的url.