Python实战（二）—— urllib2 下载网页的方式总结

最新推荐文章于 2023-11-04 20:01:13 发布

钟艾伶

最新推荐文章于 2023-11-04 20:01:13 发布

阅读量1k

点赞数

分类专栏：【Python】

本文链接：https://blog.csdn.net/Daybreak1209/article/details/60869264

版权

【Python】专栏收录该内容

7 篇文章 0 订阅

订阅专栏

方法一、最简洁

#coding:utf-8
import urllib2
import cookielib

url='http://baidu.com'

print "method 1"
responce1=urllib2.urlopen(url)
print responce1.getcode() #200
print len(responce1.read()) #81

方法二、添加data、http header信息

print "method 2"
request=urllib2.Request(url)
request.add_header("User-Agent","Mozilla/5.0")
responce2=urllib2.urlopen(request)
print responce2.getcode() #200
print len(responce2.read()) #81

方法三、添加处理器

print "method 3"
cj=cookielib.CookieJar()
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
urllib2.install_opener(opener)
responce3=urllib2.urlopen(url)

print cj #<CookieJar[]>
print responce3.getcode() #200
print responce3.read() #81

每个方法依次升级，应用于模拟更丰富的http请求下载网页。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

钟艾伶

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python实战（二）—— urllib2 下载网页的方式总结

方法一、最简洁 #coding:utf-8import urllib2import cookieliburl='http://baidu.com'print "method 1"responce1=urllib2.urlopen(url)print responce1.getcode() #200print len(responce1.read()) #81方法二、...
复制链接

扫一扫