Scrapy - 在下载器中间件中设置随机User-Agent

是大嘟嘟呀

已于 2022-03-11 18:07:01 修改

阅读量10w+

点赞数 3

分类专栏：网络爬虫 Scrapy 文章标签： python chrome 开发语言

于 2021-06-19 14:37:25 首次发布

本文链接：https://blog.csdn.net/MarkAdc/article/details/118053510

版权

网络爬虫同时被 2 个专栏收录

29 篇文章 5 订阅

订阅专栏

Scrapy

6 篇文章 0 订阅

订阅专栏

项目目录

在这里插入图片描述

在middlewares.py中
编写随机User-Agent的逻辑

import random


class RandomUserAgent:
    def get_ua(self):
        a = random.randint(55, 62)
        c = random.randint(0, 3200)
        d = random.randint(0, 150)
        os_type = [
            '(Windows NT 6.1; WOW64)', '(Windows NT 10.0; WOW64)', '(X11; Linux x86_64)',
            '(Macintosh; Intel Mac OS X 10_12_6)'
        ]
        chrome_version = f'Chrome/{a}.0.{c}.{d}'
        ua = ' '.join(
            ['Mozilla/5.0', random.choice(os_type), 'AppleWebKit/537.36', '(KHTML, like Gecko)', chrome_version,
             'Safari/537.36'])
        return ua

    def process_request(self, request, spider):
        request.headers['User-Agent'] = self.get_ua()

在settings.py中
开启上面写的中间件

DOWNLOADER_MIDDLEWARES = {
    'scrapy_test.middlewares.RandomUserAgent': 100,
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

是大嘟嘟呀

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scrapy - 在下载器中间件中设置随机User-Agent

项目目录在middlewares.py中import randomclass RandomUserAgent: def get_ua(self): first_num = random.randint(55, 62) third_num = random.randint(0, 3200) fourth_num = random.randint(0, 150) os_type = [ '(Window.
复制链接

扫一扫