转载自:http://developer.51cto.com/art/201003/188558.htm
Python抓站在我们解决某些搜索引擎中的问题时有很广泛的应用。但是有些代码我们还是不能熟练的掌握。下面我们就详细的看看如何进行相关的问题解决。希望大家对Python抓站有所收获。
使用代理服务器
这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受到限制等等。
import urllib2
proxy_support = urllib2.ProxyHandler({'http':'http://XX.XX.
XX.XX:XXXX'})
opener = urllib2.build_opener(proxy_support, urllib2.
HTTPHandler)
urllib2.install_opener(opener)
content = urllib2.urlopen('http://XXXX').read()
以上就是对Python抓站有关问题的详细介绍。