如题。
python字符串处理中经常遇到类似u"测试"、r"love\n"等等形式。
分析:
python2中,u表示unicode string,表示使用unicode进行编码,没有u表示byte string,类型是str,在没有声明编码方式时,默认ASCI编码。如果要指定编码方式,可在文件顶部加入类似如下代码:
# -*- coding: utf-8 -*-
或者
# -*- coding: cp936 -*-
utf-8、cp936是两种编码方式,都支持中文,当然还有其他的编码方式,如gb2312等。
字母前加r表示raw string,与特数字符的escape规则有关,一般在正则表达式里面。r和u可以搭配使用,例如ur"abc"。特例,'r'可避免字符转义,如果字符串中包含转义字符,不加'r'会被转义,而加了'r'之后就能保留。