【报错】This user agent has been blocked due to abuse 爬虫被封IP解决

一、报错形式

记录一下,今天继续做我的毕设,爬crt.sh站记录时,发现我的IP被封掉了……

requests.get('https://crt.sh/?q=' + domain, headers=headers,verify=False)

我得到了这样的结果,requests请求返回如下:
在这里插入图片描述

This user agent has been blocked due to abuse. Can we interest you direct access to the crt.sh DB to fetch the data you want? https://groups.google.com/g/crtsh/c/sUmV0mBz8bQ/m/K-6Vymd_AAAJ

以及手动请求:
在这里插入图片描述

二、报错原因

爬虫导致IP被封

解决方案

1.PPPOE路由器重置,自动更换本机公网IP(直接)

def public():  # 查看本机公网地址
    with urlopen(r'http://ip.42.pl/raw') as fd:
        f = fd.read().decode()
    print(f)

if __name__ == '__main__':
    public()

以上代码可直接查到本机的公网IP地址。

2.伪造User-Agent

1.代码

import random
import socket
import struct
from fake_useragent import UserAgent    # pip install fake-useragent

HEADERS = {
        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
        'User-Agent': "",  # 构造用户代理
        'Referer': 'https://www.google.com',
        'X-Forwarded-For': "",  # 构造
        'X-Real-IP': "",  # 构造
        'Connection': 'keep-alive',
    }

def get_ua():
    ua = UserAgent()
    ip = socket.inet_ntoa(struct.pack('>I', random.randint(1, 0xffffffff)))
    HEADERS["User-Agent"] = ua.random
    HEADERS["X-Forwarded-For"] = HEADERS["X-Real-IP"] = ip
    pyHEADERS = [
        'User-Agent: {}'.format(ua.random),
        'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
        'Referer: https://www.google.com', 'X-Forwarded-For: {}'.format(ip),
        'X-Real-IP: {}'.format(ip), 'Connection: close'
    ]
    return HEADERS

if __name__ == "__main__":
    print(get_ua())

返回结果:
在这里插入图片描述
可得:四次请求构造出不同请求头部。

2.User-Agent介绍

User-Agent又称UA,是用户代理。使得服务器能够识别客户使用的操作系统及版本、CPU类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等等。

常见用户代理:

user_agents = ['Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50','Opera/9.80 (Windows NT 6.1; U; en) Presto/2.8.131 Version/11.11']
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

微雨停了

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值