鱼c笔记——Python爬虫(三):使用User Agent和代理IP隐藏身份

本文介绍了如何在Python爬虫中修改User Agent和使用代理IP来避免被服务器识别,包括通过Request的headers参数和add_header()方法修改User Agent,以及利用ProxyHandler和build_opener()定制代理。同时,文章提到了使用代理IP时可能遇到的问题,如HTTP 503错误和连接拒绝,并给出了相应的解决建议。
摘要由CSDN通过智能技术生成

服务器检查链接一般是检查Headers里的User Agent来判断访问来源是代码还是浏览器,所以可以修改Headers达到正常访问网页的目的。


修改headers:

途径一:通过Request的headers参数修改

途径二:通过Request.add_header() 方法修改


解决面对高频率的访问IP可能会被屏蔽的方法:

一. 延迟提交的时间

import urllib.request
import urllib.parse
import json
import time


while True:
    content = input('请输入需要翻译的内容(输入'q!'退出程序):')

    if content == 'q!':
        break
    
    url =  'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/'          #链接就是Request URL的那个

    '''
    head = {}
    head['User-Agent'] = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:54.0) Gecko/20100101 Firefox/54.0'
    '''

    data = {}
    data['type'] = 'AUTO'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值