Python爬虫编程思想(10):通过urllib设置HTTP请求头

本文介绍了如何在Python的urllib中设置HTTP请求头,包括设置英文和中文请求头,以及解决设置中文请求头时遇到的编码问题,强调了HTTP请求头大小写规则的重要性。
摘要由CSDN通过智能技术生成

Python爬虫编程思想(11):用urllib请求基础验证页面

目录

1. 设置英文HTTP请求头        

2. 设置中文HTTP请求头        


1. 设置英文HTTP请求头        

        如果用爬虫向服务端发送HTTP请求,通常需要模拟浏览器的HTTP请求,也就是让服务端误认为客户端是浏览器,而不是爬虫,这样就会让服务器的某些反爬虫技术失效。但模拟浏览器发送HTTP请求需要设置名为User-Agent的HTTP请求头,除了这个请求头外,还可以会设置其他的请求头,而我们以前使用urlopen函数发送HTTP请求,请求头都使用的默认值。

        urlopen函数本身并没有设置HTTP请求头的命名参数,要想设置HTTP请求头,需要为urlopen函数传入Request对象,可以通过Request类构造方法的headers命名参数设置HTTP请求头。

        下面的例子修改了User-Agent和Host请求头,并添加了自定义请求

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值