Python爬虫——Scrapy框架安装

在编写python爬虫时,我们用requests和Selenium等库便可完成大多数的需求,但当数据量过大或者对爬取速度有一定要求时,使用框架来编写的优势也就得以体现。在框架帮助下,不仅程序架构会清晰许多,而且爬取效率也会增加,所以爬虫框架是编写爬虫的一种不错的选择。

对于python爬虫框架,目前较为热的是Scrapy,其是一个专门爬取web结构性数据的应用框架。Scrapy是一个强大的框架,所依赖的库也较多,比如有lxml,pyOpenSSL和Twisted等,这些库在不同的平台下要求也不一样,虽然如此,但实际上安装还是较简单的,But有时安装过程中error却不少,下面就介绍安装方法及错误处理办法。

笔者环境:Win10 + python3.6.5

安装方法

虽然前面提到过Scrapy依赖的库较多,但安装时可以直接使用pip命令进行安装,同时一些依赖的库也会自动安装:

pip install Scrapy

验证安装

安装之后,在命令行直接输入scrapy,若输出如下类似信息则说明安装成功

$_~FEQA%ZGH(XS@I7WRIU`T

错误处理(部分,在此列出笔者安装过程中遇到的错误)

error: Microsoft Visual C++ 14.0 is required

G)MS3L(R`RX502VO}M7%BPM

这个error很明显,按提示安装Microsoft Visual C++ 就行了,笔者后在官网上下载并安装Visual Studio 2017得以解决此问题

UnicodeDecodeError:’utf-8’ codec can’t decode byte 0xce in posiyion 98: invalid continuation byte

KH6Q0E8`SJC[CYK7)_E`D$4

这一错误是编码问题,开始我也是一脸茫然,查阅资料后发现了不少的解决办法,其实错误原因很简单,因为windows中编码格式为‘gbk’,所以安装中’utf-8’不行(错误提示也说明了不能编码),那这要怎么解决呢?

首先,根据错误流确定出错文件位置:C:\Users\Littl\AppData\Local\Programs\Python\Python36\Lib\site-packages\pip\compat,打开文件__init__.py,找到73行附近,将’utf-8’全部改为’gb2312’,保存再次安装即可

image

9OB4)03BOSWKH_2_NAS5}26

以上为笔者安装过程中遇到的问题,在排错时也发现其实对于不少不明觉厉的错误,慢慢理解错误提示和流都可以很好地解决,如果还有其他问题的话可以根据错误提示查阅下相关网上资料,也欢迎留言学习交流。

转载于:https://www.cnblogs.com/Unikfox/p/9589302.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值