因为学习了一些python的基本语法,对python抓包有了点兴趣,所以开始记录一下自己的抓包学习。
import urllib2
response = urllib2.urlopen("http://www.baidu.com")
print response.read()
上面是简单的抓取百度首页的代码,
urlopen一般接受三个参数:urlopen(url, data, timeout),
url即为URL,data是访问URL时要传送的数据,timeout是设置超时时间。data和timeout可以为空,默认值分别为None和socket._GLOBAL_DEFAULT_TIMEOUT。
我们传送了百度的URL,执行urlopen方法之后,返回一个response对象。
response对象有一个read方法,可以返回获取到的网页内容。
如下代码效果一样:
import urllib2
request = urllib2.Request("http://www.baidu.com")
response = urllib2.urlopen(request)
print response.read()
通过构建一个request,服务器响应请求得到应答。(urlopen参数可以传入一个request请求,它其实就是一个Request类的实例)
这样完成了一个最简单不过的案例了,后面继续跟进深入学习。