u/U:表示unicode字符串
不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码。一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u;但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。
建议所有编码方式采用utf-8,即在py文件开头添加: # coding: utf-8
r/R:非转义的原始字符串,r表示raw string
一般用在以下两个方面:
1、正则表达式,对应着re模块
用于处理正则表达式时,规避反斜杠的转义
search = re.compile(r'\s*')
2、系统路径如下面的路径,使用r就防止了\t的转义
file_path = r'F:/test.xlsx'
扩展:
与普通字符相比,其他相对特殊的字符,其中可能包含转义字符,即那些,反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的”\n”表示换行,”\t”表示Tab等。而如果是以r开头,那么说明后面的字符,都是普通的字符了,即如果是“\n”那么表示一个反斜杠字符,一个字母n,而不是表示换行了。
a = "hello,\nworld"
b = r"hello,\nworld"
print("string a:", a)
print("string b:", b)
输出结果:
string a: hello,
world
string b: hello,\nworld
注:python3默认编码方式就是utf-8, 需要注意的是r。