1.问题:在学习python时使用urllib下载文件到本地时,总是无法创建带有中文的文件名,源码如下
ab_stc = 'http://www.xiaohuar.com' + src[0] # 相对路径拼接
# 文件名,因为python27默认编码格式是unicode编码,因此我们需要编码成utf-8
file_name = '%s_%s_%s.jpg' % (i-1,school[0].encode('utf-8'), name[0].encode('utf-8'))
file_path = os.path.join(os.getcwd(),file_name)
urllib.urlretrieve(ab_stc,file_path)
出现如下错误:
IOError: [Errno 22] invalid mode ('wb') or filename: 'D:\\PyWorkspace\\p1\\p1\\spiders\\0_\xe5\xa4\xa7\xe8\xbf\x9e\xe6\xb5\xb7\xe4\xba\x8b\xe5\xa4\xa7\xe5\xad\xa6_\xe7\x89\x9b\xe6\x99\xa8\xe6\x99\x93.jpg'
2.原因:python中默认使用unicode编码,将一个包含中文的utf-8编码的字符串用于创建文件时会出现上图错误中的情况,应该将encode('utf-8')去掉,或者在字符串前加上u,如 u"一张图片.jpg"
3.结果:去掉后可以正常创建包含中文的文件