python 实现爬虫下载网页的方法

最新推荐文章于 2023-04-24 14:15:00 发布

weixin_34361881

最新推荐文章于 2023-04-24 14:15:00 发布

阅读量180

点赞数

原文链接：http://www.cnblogs.com/kanbudong/p/5903161.html

版权

第一种下载网页方法
import urllib2
#直接请求
response = urllib2.urlopen("http://www.baidu.com/")
#读取内容
cont= response.read()
#获取状态码，返回200表示成功
print response.getcode()

第二种下载网页方法
import urllib2
response = urllib2.Request(url)
#添加数据
request.add_date('a','1')
#添加http的header
request.add_header('User-Agent','Mozilla/5.0')
#发送请求获取结果
response = urllib2.urlopen(request)

第三种下载网页方法（特殊场景、例如需要登录）
import urllib2，cookielib

#创建cookie容器
cj = cookielib.CookieJar()

#创建一个opener
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

#给urllib2安装opener
urllib2.install_opener(opener)

#使用带cookie的urllib2访问网页
response = urllib2.urlopen("http://www.baidu.com/")

转载于:https://www.cnblogs.com/kanbudong/p/5903161.html

weixin_34361881

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python 实现爬虫下载网页的方法

第一种下载网页方法import urllib2#直接请求response = urllib2.urlopen("http://www.baidu.com/")#读取内容cont= response.read()#获取状态码，返回200表示成功print response.getcode()第二种下载网页方法import urllib2response = urllib2.Request(...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。