python的爬虫框架scrapy安装和简单使用

环境:windows下的

1.安装pyhon

地址:https://www.python.org/downloads/(python官网下载)

本人用的python2.7版本的,python安装好后,然后设置的它的环境变量,电脑-》属性》高级系统设置-》环境变量设置,找到PATH,

把python的路径如:C:\Python27加入里面,C:\Python27\Scripts也加入里面就可以直接在cmd.exe,调用easy_install或pip安装命令。


2.安装pywin32

地址:http://www.softpedia.com/get/Programming/Other-Programming-Files/PyWin32.shtml#download


3.安装scrapy

打开cmd.exe,使用easy_install或pip install scrapy,就可以了;其他依赖库会自动安装的,例如twisted, lxml


4.Scrapy的简单应用:

(1)创建一个scrapy项目:命令为scrapy startproject 项目名;

   项目目录:


(2)文件说明:

      settings.py:配置文件,如递归层数,并发数等

      items.py   :  结构化数据,数据模板(如:Django的model)

      spiders    :爬取网页数据的

      pipelines.py: 对爬取的数据进行数据处理,简单来说就是用来保存数据;

      scrapy.fg:  项目的配置信息


(3)代码实例:

settings.py

 


去掉注释

settings.py


spider.py




pipelines.py




创建main.py,运行:



       


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值