scrapy写爬虫

当您需要从某个网站中获取信息,但该网站未提供API或能通过程序获取信息的机制时, Scrapy可以助你一臂之力。

安装

转载自:在centos7和centos6下安装scrapy

首先准备环境>

yum install gcc libffi-devel openssl-devel libxml2 libxslt-devel libxml2-devel python-devel -y

安装easy_install>

yum install python-setuptools

安装pip>

easy_install pip

安装 lxml>

easy_install lxml

如果以上都顺利,就开始安装scrapy吧>

pip install scrapy

hello项目

创建项目>

scrapy startproject hello

该命令将会创建一个hello目录,就是项目hello的根目录,项目结构如下:

.
|-- hello  # 该项目的python模块。之后您将在此加入代码。
|   |-- __init__.py   ##
|   |-- items.py      ## 项目中的item文件
|   |-- middlewares.py  ## 没弄明白
|   |-- pipelines.py  ## 项目中的pipelines文件
|   |-- settings.py   ## 项目的设置文件
|   `-- spiders   ## 放置spider代码的目录
|       `-- __init__.py  ##
|
`-- scrapy.cfg  ##  项目的配置文件

注意: 右边的##是我为了方便理解标明的注释

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值