菜鸟教程python正则表达式_Python正则表达式就是这么简单【新手必学】

前言

本篇文章带大家快速入门正则表达式的使用,正则表达式的规则不仅适用python语言,基本大多数编程语言都适用,在日常使用中极为广泛,读者们有必要学好正则表达式。看完这篇文章,读者们要理解什么是正则表达式,正则表达式的规则,常见的正则表达式示例,如何在python中使用函数进行正则表达式操作;

二 正则表达式的概念

正则表达式是指在一串字符串中使用特殊的模式匹配获得子串,我们可以对获得的子串进行提取,替换等操作;

举个例子zszxz666 这个字符串,现在知识追寻者想要获得子串zszxz, 则需要经过一个模式匹配后获得子串,在正则表达式中这个模式可以很多种格式,知识追寻者在这边使用最简单的模式 [a-z]*,然后经过python正则表达式匹配函数就可以获得子串zszxz;这种方式比平时的字符串函数操作更加简便,适用范围广泛;

ps:另外很多人在学习Python的过程中,往往因为没有好的教程或者没人指导从而导致自己容易放弃,为此我建了个Python交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了,里面有最新Python教程项目可拿,不懂的问题多跟里面的人交流,都会解决哦!

三 常用的正则匹配模式

常用的正则表达式模式如下,如果对这些模式有疑惑的可以参照 正则表达式手册 ;手册中还有日常使用的正则示例,比如用户名,密码,邮箱,URL 的匹配模式等;

模式含义

^匹配字符串的开头

$匹配字符串的末尾

.匹配任意字符,除了换行符

+匹配前面的子表达式一次或多次

?匹配前面的子表达式零次或一次,或表示一个非贪婪限定符

*匹配前面的子表达式零次或多次

\转义特殊字符

\d匹配任意数字,等价于 [0-9]。

\D匹配任意非数字

\s匹配任意空白字符(制表,换行,回车,换页,垂直制表),等价于[^\f\n\r\t\v]

\S匹配任何非空白字符。等价[^\f\n\r\t\v]

\w匹配数字字母下划线

\W匹配非数字字母下划线

[…]用来表示一组字符;[amk] 匹配 ‘a’,‘m’或’k’

[^…]不匹配在[]中的字符;[^amk]不匹配 ‘a’,‘m’或’k’

{n}匹配前面的子表达式n 次

{n,}匹配前面的子表达式至少n 次

{n,m}匹配前面的子表达式最少匹配 n 次且最多匹配 m 次

|表示或;a| b,表示匹配a或者b

\b匹配一个单词边界,即字与空格间的位置

\B非单词边界匹配

四 python正则常用修斯符

re.I使匹配对大小写不敏感

re.L做本地化识别(locale-aware)匹配

re.M多行匹配,影响 ^ 和 $

re.S使 . 匹配包括换行在内的所有字符

re.U根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.

re.X该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解

五 python常用正则行数说明

pattern 表示正则表达式模式

string 表示传入待匹配字符串

flags 标志位,可以用第四节的修饰符限定

count 表示限定匹配的次数

repl 表示替换的字符串,也可为一个函数

pos 起始位置

endpos 结束位置

maxsplit 最大分割次数

函数名称函数含义

re.findall(string, pos, endpos)匹配所有子串,并返回一个列表,未匹配,则返回空列表

re.match(pattern, string, flags=0)从字符串的起始位置匹配一个模式,如果匹配失败返回None

re.search(pattern, string, flags=0)扫描整个字符串并返回第一个成功的匹配;匹配失败返回None

re.compile(pattern, flags=0)编译正则表达式,生成一个正则表达式( Pattern )对象

re.sub(pattern, repl, string, count=0, flags=0)查找和替换

re.finditer(pattern, string, flags=0)与findall类似,返回的是迭代器

re.split(pattern, string, maxsplit=0, flags=0])将匹配的子串分割后返回列表

六 常用函数示例

6.1 match函数

group(num=0) 函数表示提取匹配的表达式,可以使用组号提取对应的匹配结果;知识追寻者想要获得字符串中第一个出现的数字串;

import re

# 指定模式 至少匹配一个数字

pattern = re.compile(r'\d+')

# 输入的字符串

mat = pattern.match("451zszxz666")

# 获得第一个匹配到的值

g = mat.group();

# 451

print(g)

6.2search函数

知识追寻者想要获得指定的字符串,第一个匹配的就好;

import re

# 想匹配nhzszxz 或者 nh666 或者 nhnh

pattern = re.compile(r'nh(zszxz|666|nh)')

ser = pattern.search('nhzszxzkkk nh666 llll nhnh')

g_0 = ser.group()

# zszxz

print(g_0)

g_1 = ser.group(1)

# nhzszxz

print(g_1)

6.3 findall函数

知识追寻者想要在字符串中获得所有的数字;

import re

pattern = re.compile(r'\d+')

# 输入的字符串

mat = pattern.fidall("451zszxz666")

# ['451', '666']

print(mat)

# 666

print(mat[1])

6.6 sub函数

知识追寻者想要获得所有非数字的子串;

import re

str = '8556gfggs5555dfg'

# 替换所有数字

result = re.sub(r'\d', '', str)

# gfggsdfg

print(result)

6.7 split函数

知识追寻者想要获得以,分割的字符串;

import re

str = '123,456,zszxz,666'

result = re.split(',',str)

# ['123', '456', 'zszxz', '666']

print(result)

6.8 finditer 函数

知识追寻者想要获得数字451,和666;

import re

pattern = re.compile(r'\d+')

# 输入的字符串

mat = pattern.finditer("451zszxz666")

for it in mat:

print(it.group())

七 初学者使用正则表达式正确的姿势

初学者在使用正则表达式的时候难免会得到的匹配的结果与自己预期的不符合,可以借助一些在线工具匹配完成后再进行代码编写,常用的在线正则匹配测试如下;

在线工具

站长工具

-----以上就是本次分享:另外很多人在学习Python的过程中,往往因为没有好的教程或者没人指导从而导致自己容易放弃,为此我建了个Python交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了,里面有最新Python教程项目可拿,不懂的问题多跟里面的人交流,都会解决哦!

本文的文字及图片来源于网络加上自己的想法,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值