python 3中\w+匹配汉字的问题。

最新推荐文章于 2024-05-09 19:48:23 发布

qq_24499417

最新推荐文章于 2024-05-09 19:48:23 发布

阅读量4.5k

点赞数 3

分类专栏： Python 文章标签： python 3 \w 正则汉字问题

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_24499417/article/details/82079396

版权

Python 专栏收录该内容

39 篇文章 1 订阅

订阅专栏

今天记录一下有关python 3中正则表达式的一个小问题。

我们知道正常情况下，\w+匹配字母数字及下划线，相当于[A-Za-z0-9_]。

在python 3中我们试下\w+的匹配字符串的时候,会发现匹配会匹配到中文汉字。如下图所示：

这是什么原因呢？在python 3里面,默认的是Unicode编码。正则也是默认的编码模式。我们知道unicode编码由字母和数字构成。这就造成了\w+可以匹配到中文。那么怎么处理呢。我们需要将正则的匹配模式修改为二进制匹配，就会得到正确的结果。flag设置为re.A就可以了。

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
python 3中\w+匹配汉字的问题。

今天记录一下有关python 3中正则表达式的一个小问题。我们知道正常情况下，\w+匹配字母数字及下划线，相当于[A-Za-z0-9_]。在python 3中我们试下\w+的匹配字符串的时候,会发现匹配会匹配到中文汉字。如下图所示：这是什么原因呢？在python 3里面,默认的是Unicode编码。正则也是默认的编码模式。我们知道unicode编码由字母和数字构成。这...
复制链接

扫一扫

专栏目录

qq_24499417 CSDN认证博客专家 CSDN认证企业博客

码龄10年

107: 原创

23万+: 周排名

46万+: 总排名

49万+: 访问

: 等级

4435: 积分

91: 粉丝

147: 获赞

44: 评论

708: 收藏

私信

关注

分类专栏

Lazarus 7篇
freebasic 7篇
Python 39篇
vba 14篇
Power Query 12篇
C/C++ 6篇
VB.NET 2篇
C# 13篇
PowerShell 5篇

最新评论

凑数求和
murongxianghe: 很大的时候怎么办呀
vba操作ie关闭窗口
qq_31858185: 主窗口还是关不掉
凑数求和
中原打铁男: 小数好像不可以
浅谈64位excel里面怎么调用32位的dll/OCX
道法自然爱编程: 大神，验证成功厉害👍🏻
网抓并将数据写入excel里
m0_58714169: 把路径换成tiktok的页面报（远程服务器返回错误: (405) 不允许的方法）是啥情况呀

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。