问题描述:
在做学校的SRTP项目,需要下载网页并储存到本地。
但网页url可能存在中文,网页源文件中也可能存在中文,需要选择合适的编码方式,已便正常显示中文。
若编码方式错误,可能出现以下问题:
1. 相关函数传参出错,如urllib.urlopen(url)函数,若url编码方式不对,会出现以下错误信息:
File "c:\Python27\lib\httplib.py", line 940, in endheaders
self._send_output(message_body)
File "c:\Python27\lib\httplib.py", line 803, in _send_output
self.send(msg)
File "c:\Python27\lib\httplib.py", line 775, in send
self.sock.sendall(str)
File "c:\Python27\lib\socket.py", line 222, in meth
return getattr(self._sock,name)(*args)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 9-10: ordinal not in range(128)
2. 文件名读取出错,如果open(filename,mode)中的filename编码出错,则会出现以下情况: