Python 正则表达式匹配中文

最新推荐文章于 2024-07-25 03:43:58 发布

diqigan3300

最新推荐文章于 2024-07-25 03:43:58 发布

阅读量295

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/wangyueyouyi/p/10019798.html

版权

在python2.x中，匹配中文，首先要声明utf8的编码方式。

# coding:utf-8

其次，被匹配的字符串一定要是utf8编码：

string = u'我是个好人。'

最后，正则表达式一定要是utf8编码：

pat = u'\u6211.*?\u3002'

注意，正则表达式要是u开头的utf8编码，而不是r开头的原始字符串。

完整示例：

# coding:utf-8

import re

string = u'我是个好人。'

pattern = u'\u6211.*?\u3002'

pat = re.compile(pattern)

print pat.findall(s)[0]

>>
我是个好人。

转载于:https://www.cnblogs.com/wangyueyouyi/p/10019798.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注