在windows上使用Python时,经常会被文件路径报出的错误搞蒙
第一种错误
比如open('C:\Users\Administrator\Desktop\test.doc').read()
就会报
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 4-5: truncated \UXXXXXXXX escape
由于’\U’是Python中32位的十六进制数值的开始,例如’\U012F3005’(32位即8个十六进制数字),而路径中’U’后面是’s’,显然是错误的,就报了语法错误:“unicode转义编解码器无法解码位置4-5的字节:截短了的 \UXXXXXXXX 转义”,这里就提示了’X’应该有8个。
第二种错误
现在我改写成’\U’,其他不变,并没有顺利的执行,接着出现这个错误:
OSError: [Errno 22] Invalid argument: 'C:\\Users\\Administrator\\Desktop\test.doc'
首先可以看到,系统很贴心的自动把不是转义字符的’\A’和’\D’多加了个’\’;其次我注意到,’\t’没有改写,Python把它识别成了’\t’水平制表符,系统没办法识别这个奇怪的路径,只好报错
解决办法
常见出现这些错误的原因就是转义字符’\’的存在,Python遇到转义字符会自动转义。解决方法有这么几种:
- 简单粗暴法:所有的’\’换成’/’,马上搞定
- 对仗工整法:所有的’\’换成’\\’,这么做Python会将所有的’\’识别为普通字符,不管后面跟什么都不会看做转义
- 清晰明了法:将路径字符串写成r’ ‘,如r’C:\Users\Administrator\Desktop\test.doc’,告诉Python,引号里的东西都是字符串,不转义
- 对症下药法:遇到会被Python识别成转义字符的,就把’\’换成’\\’;具体有哪些转义字符,可移步python转义字符,比如上面的例子,写成
open('C:\\Users\Administrator\Desktop\\test.doc').read()
就OK了,只有第一个和最后一个需要多写一个’\’