快速设置随机的UserAgent

目录

使用fake-useragent包

1.安装fake-usragent

2.实现:

3.如果你要设置成某个浏览器的UserAgent也是可以的

在Scrapy中实现随机UserAgent

方法一:直接在程序中添加UserAgent

方法二:在middlewares中添加UserAgent

方法三:直接在sttings文件里面上设置UserAgent


使用fake-useragent包

fake-useragent包含了大量的UserAgent可以随意进行替换

1.安装fake-usragent

pip install fake-useragent

2.实现

import fake_useragent
userAgen=fake_useragent.UserAgent()
for i in range(5):print(userAgen.random)

这样每次就可以随机用不同的UserAgent去访问网站,你的爬虫也没那么容易被封了

3.如果你要设置成某个浏览器的UserAgent也是可以的

例如设置成Chrome

import fake_useragent
userAgen=fake_useragent.UserAgent()
for i in range(5):print(userAgen.chrome)

设置成firefox

import fake_useragent
userAgen=fake_useragent.UserAgent()
for i in range(5):print(userAgen.firefox)

在Scrapy中实现随机UserAgent

方法一:直接在程序中添加UserAgent

# -*- coding: utf-8 -*-
import scrapy
from fake_useragent import UserAgent

class ExampleSpider(scrapy.Spider):
    name = 'example'
    header={'User-Agent':UserAgent().random}
    def start_requests(self):
        url='http://example.com'
        yield scrapy.Request(url,headers=self.header)

    def parse(self, response):
        print(response.request.headers['User-Agent'])

方法二:在middlewares中添加UserAgent

(1)在process_request()方法里面,添加一下代码

def process_request(self, request, spider):
    from fake_useragent import UserAgent
    ua = UserAgent()
    request.headers['User-Agent'] = ua.random

(2)然后把settings文件里面默认的UserAgent关闭掉

DOWNLOADER_MIDDLEWARES = {
    'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None,
    'dome1.middlewares.Dome1DownloaderMiddleware': 543,
}

(3)实现

第一次运行

第二次运行

可以看到两次运行的UserAgent都是不一样的,表示我们的随机UserAgent也是设置成功了

方法三:直接在sttings文件里面上设置UserAgent

(1)在setting文件里面添加两行代码

from fake_useragent import UserAgent
USER_AGENT=UserAgent().random

(2)实现:

第一次运行

第二次运行

可以看到两次的结果都是不一样的,说明我的的随机UserAgent已经是设置成功了呢

以上就是Scrapy设置代理IP的过程,以上教程如果觉得对你有帮助的话,请转发给更多人学习!

推荐阅读:

《快速设置Scrapy随机IP代理》:快速设置Scrapy随机的IP代理_Jun的博客-CSDN博客_scrapy 随机ip代理

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小羽Jary

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值