>>> address = '浙江省温州市龙湾区海城街道水暖市场341号'
>>> address
'\xe6\xb5\x99\xe6\xb1\x9f\xe7\x9c\x81\xe6\xb8\xa9\xe5\xb7\x9e\xe5\xb8\x82\xe9\xbe\x99\xe6\xb9\xbe\xe5\x8c\xba\xe6\xb5\xb7\xe5\x9f\x8e\xe8\xa1\x97\xe9\x81\x93\xe6\xb0\xb4\xe6\x9a\x96\xe5\xb8\x82\xe5\x9c\xba341\xe5\x8f\xb7'
>>> address.decode('utf-8')
u'\u6d59\u6c5f\u7701\u6e29\u5dde\u5e02\u9f99\u6e7e\u533a\u6d77\u57ce\u8857\u9053\u6c34\u6696\u5e02\u573a341\u53f7'
>>> add = address.decode('utf-8')
>>> span_tmp = re.search(r'[\da-zA-Z一二三四五六七八九十]+号$', add)
>>> span_tmp
>>> span_tmp = re.search(u'[\da-zA-Z一二三四五六七八九十]+号$', add)
>>> span_tmp
<_sre.SRE_Match object at 0x166A1058>
>>> span_tmp.group(0)
u'341\u53f7'
python2使用正则表达式中的编码格式问题
最新推荐文章于 2022-05-05 10:10:10 发布