研究用Python写爬虫,下载一个网页。报错代码如下
import urllib
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
html = getHtml("http://www.baidu.com")
print(html)
运行时报错:AttributeError: module 'urllib' has no attribute 'urlopen'
在网上查了一些资料,有人说是因为你的这个工程目录下可能有一个自己定义的文件与urllib重名,导致上述代码在引用时实际引用的是自定义的那个urllib,结果查找自己的项目文件夹下也没有重名的文件。其实真正原因是在Python3.X中应该用urllib.request。更改后就不会再出现这个错误了。
import urllib.request
#print(urllib.__file__)
def getHtml(url):
page = urllib.request.urlopen(url)
html = page.read()
return html
html = getHtml("http://www.baidu.com")
print(html)
运行截图如下:
本文介绍了一个常见的Python爬虫错误:使用urllib模块时遇到AttributeError异常。问题出现在尝试调用不存在的urllib.urlopen方法。文章解释了错误产生的原因在于Python版本差异,并给出了正确的解决方案,即在Python 3.x中使用urllib.request模块。
3万+

被折叠的 条评论
为什么被折叠?



