scrapy安装详解--秒懂!

-----------------------------------通过headers中的User-Agent字段来反爬--------------------------------------------------

  • 反扒原理:爬虫默认情况下没有User-Agent
  • 解决方法:请求之前添加User-Agent即可;更好的方式是使用User-Agent池来解决(收集一堆User-Agent的方式,或者是随机生成User-Agent)
import random

def get_ua():
    first_num = random.randint(55, 62)
    third_num = random.randint(0, 3200)
    fourth_num = random.randint(0, 140)
    os_type = [
        '(Windows NT 6.1; WOW64)', '(Windows NT 10.0; WOW64)', '(X11; Linux x86_64)',
        '(Macintosh; Intel Mac OS X 10_12_6)'
    ]
    chrome_version = 'Chrome/{}.0.{}.{}'.format(first_num, third_num, fourth_num)

    ua = ' '.join(['Mozilla/5.0', random.choice(os_type), 'AppleWebKit/537.36',
                   '(KHTML, like Gecko)', chrome_version, 'Safari/537.36']
                  )
    return ua

 

 

-------------------------SCRAPY在windows 下的安装-----------------------------

常见的错误:1.VC++14 TWISTED----->没有vc++的支持,这个时候需要进行离线安装------使用.whl文件进行安装

 

whl就是一种zip包格式,但是我们需要先安装wheel模块才能安装whl包。安装很简单,我们只需要在ide中输入pip install wheel即可。这种情况是在刚刚安装好python而且从没有装过wheel模块的情形下。

 

https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted  在这个网站下载whl文件

下载好了就切换到相对应的目录下面进行cmd操作:pip install *****

2.即使在安装完成后在cmd中输入scrapy命令,出现了  uasage:。。。Availble commands:.......  相关的内容,这样仍然还没有安装完成

        scrapy bench 只要一运行就会报win32的错误------》解决:pip install  pywin32

 

3.在上面的操作都完成了之后,再使用pip   install   scrapy------进行安装

   安装正常都是没有问题了,安装好了之后,再使用scrapy bench进行测试     如果出现如下的界面,说明安装成功:

 

4.在PC 的开发环境中创建scrapy项目

   首先,现在PC中穿件一个project记得使用你所安装的  Interpreter  也就是要指定你所安装好了的python

然后在磁盘中打开该项目所在的目录:

        使用  cmd  进行操作,使用   scrapy  startproject  ****

这样就大功告成!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

陶人超有料

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值