scrapy的使用

scrapy 官方文档: https://docs.scrapy.org/en/latest/

首先你要安装 scrapy

安装方法很简单,打开cmd命令行:

pip install --upgrade pip    #先升级pip
pip install scrapy           #下载scrapy

解决 Scrapy 安装错误:Microsoft Visual C++ 14.0 is required...

问题描述:
当前环境 win7,python_3.6.1,64 位。
在 windows 下,在 dos 中运行 pip install Scrapy 报错:
error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build
Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools


http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted 下载 twisted 对应版本的 whl 文件(如
我的 Twisted-18.4.0-cp36-cp36m-win_amd64.whl),
cp 后面是 python 版本,amd64 代表 64 位,运行命令:

pip install C:\Users\ibm\Downloads\Twisted-18.4.0-cp36-cp36m-win_amd64.whl

 

环境搭建---scrapy

pip install scrapy


创建项目

1) scrapy startproject 项目名称                #创建一个项目

2) cd 项目名称                                 #进入目录

3) scrapy genspider tencent hr.tencent.com    #创建一个爬虫

4) VSCode 打开项目

项目中各个文件的作用

scrapy.cfg :项目的配置文件
mySpider/ :项目的 Python 模块,将会从这里引用代码
mySpider/items.py :项目的目标文件
mySpider/middlewares.py :项目的中间件文件
mySpider/pipelines.py :项目的管道文件
mySpider/settings.py :项目的设置文件
mySpider/spiders/ :存储爬虫代码目录

运行爬虫:scrapy crawl tencent

 

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值