事情是这样的,我要通过一堆URL,自动下载网页里的文件
结果无论是执行
with open(filename, "wb") as f:
f.write(urlopen(url).read())
还是
urllib.urlretrieve(url, filename)
都会弹出标题里的报错:UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position
我搜索了一堆解决方案,包括修改系统默认编码方式,先转码等,都不行。要么是出问题的情形不同,要么就是照做了却没用。
就在我快要放弃时,我仔细地看了看报错
报错信息是ASCII无法编码这个要下载的文件。倒数第二行,显示函数默认以ASCII编码,那我跳转过去直接把它编码方式手动改了不就成了?再加上之间看别人博客时提到过,python3默认utf-8编码,所以很少碰到编码问题了,那我就试着把编码方式改成utf-8。
于是点进蓝色链接,找到1184行,把'ascii'改成'utf-8',搞定。因为直接修改了环境里的函数,所以过于暴力,我也是小白,不知道这样做会不会有问题,建议大家下载完文件后还是改回来,下次出问题了再说。