问题
你正在处理Unicode字符串,需要确保所有字符串在底层有相同的表示。
解决方案
在Unicode中,某些字符能够用多个合法的编码表示。为了说明,考虑下面的这个列子:
s1='Spicy Jalape\u00f1o'
s2='Spicy Jalapen\u0303o'
print(s1) # ->Spicy Jalapeño
print(s2) # ->Spicy Jalapeño
print(len(s1)) # ->14
print(len(s2)
问题
你正在处理Unicode字符串,需要确保所有字符串在底层有相同的表示。
解决方案
在Unicode中,某些字符能够用多个合法的编码表示。为了说明,考虑下面的这个列子:
s1='Spicy Jalape\u00f1o'
s2='Spicy Jalapen\u0303o'
print(s1) # ->Spicy Jalapeño
print(s2) # ->Spicy Jalapeño
print(len(s1)) # ->14
print(len(s2)