python2.7 正则匹配中文乱码问题

最新推荐文章于 2023-09-05 10:27:33 发布

微知girl

最新推荐文章于 2023-09-05 10:27:33 发布

阅读量1.2k

点赞数 1

分类专栏： # 编程

本文链接：https://blog.csdn.net/katrina1rani/article/details/115229800

版权

python2.7 正则表达式中文乱码编码问题 utf-8

关键词由CSDN通过智能技术生成

编程专栏收录该内容

20 篇文章 1 订阅

订阅专栏

今天遇到了python2.7 正则匹配中文乱码问题，很是崩溃，试了好多种方法，最终还是解决了，记录下

先说下我解决的方法

# coding=utf-8

import sys
# print sys.getdefaultencoding()
default_encoding = 'utf-8'
if sys.getdefaultencoding() != default_encoding:
    reload(sys)
    sys.setdefaultencoding(default_encoding)
# print sys.getdefaultencoding()


def toycase():
    sentence = '开开心心找bug！'
    pattern = u"开心([^。，,\(\)（）:：；;.]{1,20})bug"
    matchObj = re.findall(pattern, question.decode('utf8'))
    for match in matchObj:
        print(match)

划重点，开头加 “# coding=utf-8“ 一列，下面一段默认编码utf-8；然后re 内部处理这里，需要将代码处理成unicode，要和pattern编码格式一致才行

参考链接：

https://www.jb51.net/article/152272.htm

https://www.oschina.net/question/163526_31369

https://blog.csdn.net/silence2015/article/details/60321873

微知girl

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
python2.7 正则匹配中文乱码问题

今天遇到了python2.7 正则匹配中文乱码问题，很是崩溃，试了好多种方法，最终还是解决了，记录下先说下我解决的方法# coding=utf-8import sys# print sys.getdefaultencoding()default_encoding = 'utf-8'if sys.getdefaultencoding() != default_encoding: reload(sys) sys.setdefaultencoding(default_en.
复制链接

扫一扫