文章目录
正则表达式介绍
正则表达式就是描述字符串排列的一种规则,其主要用于字符串的匹配,经常用于找到某一类符合格式要求的数据;在python中我们经常用re模块来实现正则表达式
正则表达式基础
原子
原子是正则表达式最基本的组成单位,正则表达式至少包含一个一个原子,常见的原子有:
- 普通字符
- 非打印字符
- 通用字符
- 原子表
普通字符
普通字符如数字,字母,下划线等都可以作为原子,yes中含有三个原子:y、e、s
hello中含有he,所以匹配成功
非打印字符
非打印字符指的是字符串中用于格式控制的符号常见的有\n换行符,\t制表符
a中有换行,所以匹配成功
通用字符
通用字符:一个原子可以匹配一类字符,人们常用的
常见的通用字符及其意义
字符 | 意义 |
---|---|
\w | 匹配任意一个字母、数字或下划线 |
\W | 匹配除字母、数字和下划线以外的任意一个字符 |
\d | 匹配任意一个十进制数 |
\D | 匹配除十进制数以外的任意一个字符 |
\s | 匹配任意一个空白字符 |
\S | 匹配除空白字符以外的任意一个字符 |