Python爬取网页动态数据出现urllib.error.HTTPError: HTTP Error 504: Gateway Time-out问题

方法一、为urlopen设置可选参数 timeout 

import time
url = 'http://zfcj.gz.gov.cn/zfcj/fyxx/xmxkbxxView'

headers = {
    # 'Cookie': 'JSESSIONID = 8C7817E6724F3E07A80D6CA9B3246069; UqZBpD3n3iXPAw1X = v1Si-sgwSDT9p',
    'User-Agent': 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)'
}

data = {
    'token': token,
}

# url 请求地址
# data 请求参数
# kwargs 字典
response = requests.post(url=url, data=data, headers=headers,timeout=10)
content = response.text
response.close()



方法二、设置全局的socket超时:
import socket
socket.setdefaulttimeout(10.0)


方法三、设置出现异常重试:

加上这个注解这个方法出现异常的时候就会重试

from retrying import retry
@retry(stop_max_attempt_number=5, wait_fixed=2000)
def create_request(token):


    url = 'http://zfcj.gz.gov.cn/zfcj/fyxx/xmxkbxxView'

    headers = {
        # 'Cookie': 'JSESSIONID = 8C7817E6724F3E07A80D6CA9B3246069; UqZBpD3n3iXPAw1X = v1Si-sgwSDT9p',
        'User-Agent': 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)'
    }

    data = {
        'token': token,
    }

    # url 请求地址
    # data 请求参数
    # kwargs 字典
    response = requests.post(url=url, data=data, headers=headers,timeout=10)
    content = response.text
    response.close()

    tree = etree.HTML(content)
    result = tree.xpath('//a[@class="a_block"]/@onclick')
    return result
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
回答: HTTP Error 504: Gateway Time-out是一个常见的错误,表示网关超时。这通常是由于服务器在请求的时间内没有收到响应而导致的。解决这个问题的方法有几种。引用\[1\]中提到的第一种方法是为urlopen设置timeout参数,这样可以在请求超时时抛出异常,避免程序卡死。另一种方法是使用retrying库,通过设置重试次数和重试间隔来处理异常,如引用\[2\]所示。这样可以在出现异常时自动重试请求,提高程序的稳定性。所以,你可以尝试在你的代码中使用这些方法来解决HTTP Error 504: Gateway Time-out的问题。 #### 引用[.reference_title] - *1* *2* [Python爬取网页动态数据出现urllib.error.HTTPError: HTTP Error 504: Gateway Time-out问题](https://blog.csdn.net/sfwqwfew/article/details/127880014)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Python学习笔记(二)urllib.urlopen()超时问题 : 504Gateway Time-out](https://blog.csdn.net/m0_37374307/article/details/80326715)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值