实际上,最简单的方法是:import urllib2 # the lib that handles the url stuff
data = urllib2.urlopen(target_url) # it's a file like object and works just like a file
for line in data: # files are iterable
print line
你几乎不需要注释。你甚至可以把它缩短到import urllib2
for line in urllib2.urlopen(target_url):
print line
但请记住,在Python中,可读性很重要。
然而,这是最简单的方法,但不是安全的方法,因为在大多数情况下,在网络编程中,您不知道期望的数据量是否会得到尊重。因此,您通常最好阅读一份固定的、合理的数据,您知道这些数据足以满足您所期望的数据,但可以防止您的脚本被淹没:import urllib2
data = urllib2.urlopen("http://www.google.com").read(20000) # read only 20 000 chars
data = data.split("\n") # then split it into lines
for line in data:
print line在python 3及以上使用urllib.请求代替urllib 2