PYTHON 之正则表达式 RE

最新推荐文章于 2022-03-30 19:58:16 发布

戈扬

最新推荐文章于 2022-03-30 19:58:16 发布

阅读量130

点赞数

分类专栏： PYTHON

PYTHON 专栏收录该内容

67 篇文章 20 订阅

订阅专栏

正则表达式(RegularExpression, re)

是一个计算机科学的概念
用于使用单个字符串来描述，匹配符合某个规则的字符串
常常用来检索，替换某些模式的文本

正则的写法

.(点号):表示任意一个字符，除了\n, 比如查找所有的一个字符 .
[]: 匹配中括号中列举的任意字符，比如[L,Y,0] , LLY, Y0, LIU
\d: 任意一个数字
\D:除了数字都可以
\s:表示空格，tab键
\S:除了空白符号
\w: 单词字符，就是a-z, A-Z, 0-9, _
\W: 除了
：表示前面内容重复零次或者多次， \w
+: 表示前面内容至少出现一次
？：前面才出现的内容零次或者一次
{m,n}:允许前面内容出现最少m次，最多n次
^:匹配字符串的开始
$:匹配字符串的结尾
\b:匹配单词的边界

():对正则表达式内容进行分组，从第一个括号开始，编号逐渐增大

  验证一个数字： ^\d$
  必须有一个数字，最少一位：^\d+$
  只能出现数字，且位数为5-10位： ^\d{5,10}$
  注册者输入年龄，要求16岁以上，99岁以下： ^[16-99]$
  只能输入英文字符和数字： ^[A-Za-z0-9]$
  验证qq号码： [0-9]{5,12}

\A: 只匹配字符串开头， \Aabcd, 则abcd
\Z: 仅匹配字符串末尾， abcd\Z, abcd
|: 左右任意一个
(?P…): 分组，除了原来的编号再制定一个别名， (?P12345){2}， 1234512345
(?P=name): 引用分组，

RE使用的大概步骤

使用compile将表示正则的字符串编译为pattern对象
通过pattern对象提供一系列方法对文本进行查找匹配，获得匹配结果，一个match对象
最后使用match对象提供的的属性和方法获得信息，根据需要进行操作

RE常用函数

group() 获得一个或者多个匹配的字符串，当获得整个匹配的子串时，直接使用group获得group（0）
start：获得分组匹配的子串在整个字符串中的起始位置，参数默认为0
end：获得分组匹配的子串在整个字符串中的结束位置，参数默认为0
span：返回的结构技术(start(group),end(group))

在这里插入代码片

戈扬

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PYTHON 之正则表达式 RE

正则表达式(RegularExpression, re)是一个计算机科学的概念用于使用单个字符串来描述，匹配符合某个规则的字符串常常用来检索，替换某些模式的文本正则的写法.(点号):表示任意一个字符，除了\n, 比如查找所有的一个字符 .[]: 匹配中括号中列举的任意字符，比如[L,Y,0] , LLY, Y0, LIU\d: 任意一个数字\D:除了数字都可以...
复制链接

扫一扫