python re 模块的使用,遇到中文字符的时候,需要把模式字符串和源字符串都解码!!!
使用python 的re模块~半天了还是出现错误
要处理文本:吉林省政府国有资产监督管理委员会党委委员、副主任王艺新接受组织调查
<pre name="code" class="python"> regex_str = r'\S*[市区弄号楼路道]'
city_pattern = re.compile(regex_str)
这一段代码,得出的结果总不对~
原文字:内蒙古乌兰察布市市委副书记、市长陶淑菊接受调查
运行结果:
内蒙古乌兰察布市市委副书记、市长陶淑菊接受调查
西八~~~~~~
摸索半天,把源文字,匹配字符串都解码了就好了~
再次~~~西八~~~python的字符类型问题