Python之正则表达式基础语法

最新推荐文章于 2024-08-09 09:53:48 发布

萨姆.博迪

最新推荐文章于 2024-08-09 09:53:48 发布

阅读量592

点赞数 2

文章标签：字符串正则表达式 python

本文链接：https://blog.csdn.net/weixin_45694013/article/details/110007277

版权

本文介绍了Python中正则表达式的基础语法，包括基本匹配、元字符、简写字符集、零宽度断言和标志等内容，通过实例解析了点运算符、字符集、重复次数等概念，并提供了在线测试正则表达式的网址。

摘要由CSDN通过智能技术生成

做项目，遇到需要用正则表达式来处理文本数据，菜鸡的我又开始了现学现卖的自我救赎之路。现学现卖的过程中将笔记心得记录下来，以供后续温习，或者给他人提供帮助。边学边记，文章若有什么不妥，欢迎评论区怼我，谢谢。

正则表达式是一组由字母和符号组成的特殊文本，它可以用来从文本中找出满足你想要的格式的句子。

在python中使用正则表达式的正确打开方式如下：

import re
pattern = re.compile(r'[A-Za-z0-9-]')   #编译字符串
a = '我好菜鸡a我好菜鸡123-'
b = pattern.findall(aa)
b

输出结果

['a', '1', '2', '3', '-']
#把字符串中的英文（大小写都有）、数字以及'-'找出来

只需要将正则表达式放到 r’ ' 引号里即可。
okay，正则表达式千变万化，具体的怎么匹配出自己想要的字符，还是要从底层去了解一下各种符号的含义，而不是直接去网上搜常用的正则表达式，虽然一般的需求都能在网上找到，但是不够灵活。
先来一个在线测试正则表达式的网址：在线练习

匹配具体的一个词，例如the（注意大小写敏感）

pattern = re.compile(r'the')
aa = 'the我好菜鸡a我好菜鸡123-'
b = pattern.findall(aa)
b

输出结果

['the']

看到了吧，就是这么简单！！！

正则表达式主要依赖于元字符。元字符不代表他们本身的字面意思，他们都有特殊的含义。一些元字符写在方括号中的时候有一些特殊的意思。以下是一些元字符的介绍：

怎么样，是不是会了？（手动狗头，我们使用大量的例子来解释）

. 运算符属于最简单的一个例子了吧。可以匹配任意一个字符。
比如’.the’就是要匹配出后面跟着”the“的字符串

pattern = re.compile(r'.the')
aa = 'a啊the我好菜鸡a我好菜鸡123-'
b = pattern.findall(aa)
b

输出结果

['啊the']

方括号[]用来指定一个字符集。括号里面可以用-来表示字符的

关注