使用scrapy框架爬取数据

本文档详细介绍了如何在Anaconda环境中搭建Scrapy爬虫项目,包括环境准备、报错处理及创建并运行项目的过程。在环境准备阶段,通过conda创建Python环境并安装Scrapy和pywin32模块。在报错处理部分,针对遇到的service_identity、lxml版本、Scrapy安装错误和win32api模块问题提供了解决方案。最后,讲解了如何创建Scrapy项目,定义items、pipelines以及如何运行爬虫。
摘要由CSDN通过智能技术生成

一、环境准备

首先我采用anacoda环境,需要首先建造一个项目,并激活

建立一个爬虫项目:

conda create -n Spider python == 3.6.2

conda create -n Spider python == 3.6.2

然后激活环境

activate Spider

再此环境下需要下载scrapy模块和pywin32模块

pip install scrapy

pip install pywin32

具体Scrapy 安装流程参考:http://doc.scrapy.org/en/latest/intro/install.html#intro-install-platform-notes 里面有各个平台的安装方法

二、报错处理:

1、使 用 Scrapy 时 遇 到 0: UserWarning: You do not have a working installation of theservice_identity module: 'cannot import name 'opentype''. Please install it from ..的问 题解决http://www.bubuko.com/infodetail-2467560.html

2、报 etree的错误

原因:默认安装的 lxml 版本太高(默认安装最新版),卸载后,重新安装 3.8 以下版本
conda uninstall lxml
conda install lxml==3.8

3、解决 Scrapy 安装错误:Microsoft Visual C++ 14.0 is required... 问题描述:
当前环境 win7,python_3.6.1,64 位。
在 windows 下,在 dos 中运行 pip install Scrapy 报错:
error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

解决方法;

http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted 下载 twisted 对应版本的 whl 文件(如我的 Twisted-18.4.0-cp36-cp36m-win_amd64.whl),cp 后面是 python 版本,amd64 代表 64 位,运行命令:
pip install C:\

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值