4.正则表达式中关于\b的理解（Python版）

最新推荐文章于 2024-04-26 14:01:02 发布

今天加油鸭�

最新推荐文章于 2024-04-26 14:01:02 发布

阅读量2.6k

点赞数 1

文章标签： python 正则表达式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44037569/article/details/116330885

版权

今天在做数据清洗的时候看到\b有点晕乎乎的，参考了一下大佬们的文章虽然讲的很好但是字太多了，今天我来说一个简化版本，保证你们神清气爽~

基础知识：

\w:单词字符A-Z a-z 0-9

\W:^\w

\b:匹配\w和\W之间的

\B:^\b

好了，我知道你们已经晕了嘿嘿嘿，开始说人话~

例子讲解：

我们要将类似于Co的字母去掉（这里就是一些乱码，没有实际含义，让数据变的干净一些方便后面分析）

咱们主要讲解这里：

\b\w{1,2}\b

拆解：

\b代表边界，单词边界指的就是单词与符号/非单词中间的边界

w{1,2}代表单词字符A-Z a-z 0-9最少一个最多两个

合在一起：

单词字符A-Z a-z 0-9最少一个最多两个，用非单词字母（就是一些空格、\n \t…）作为边界给他们区分开

放在例子中：

我需要把处在两个空格中的长度为2的Co筛选出来

菜鸟刚开始学，如果有说的不对的地方欢迎指正，一起加油嘿嘿嘿~

今天加油鸭�

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
4.正则表达式中关于\b的理解（Python版）

今天在做数据清洗的时候看到\b有点晕乎乎的，参考了一下大佬们的文章虽然讲的很好但是字太多了，今天我来说一个简化版本，保证你们神清气爽~基础知识：\w:单词字符A-Z a-z 0-9\W:^\w\b:匹配\w和\W之间的\B:^\b好了，我知道你们已经晕了嘿嘿嘿，开始说人话~例子讲解：我们要将类似于Co的字母去掉（这里就是一些乱码，没有实际含义，让数据变的干净一些方便后面分析）咱们主要讲解这里：\b\w{1,2}\b拆解：\b代表边界，单词边界指的就是单
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。