python爬虫-17-python之正则表达式,以最快的速度获取有效数据(下)

1、python匹配以什么什么开头

方法:

^  # 脱字号

示例:

import re

Jier = 'yunweijia0909'
Suner = re.match('^yun', Jier)
print(Suner.group())

输出结果如下:

yun

2、python匹配以什么什么结尾

方法:

$

示例:

import re

Jier = 'yunweijia0909'
Suner = re.search('0909$', Jier)
print(Suner.group())

输出结果如下:

0909

3、python匹配多个表达式或者字符串

方法:

|  # 两个匹配到一个就算成功

示例:

import re

Jier = 'yunweijia0909'
Suner = re.search('nihao|0909', Jier)
print(Suner.group())

输出结果如下:

0909

4、python贪婪模式和非贪婪模式

贪婪模式:正则表达式会匹配尽量多的字符,默认是贪婪模式。

非贪婪模式:正则表达式会尽量少的匹配字符。

方法:

贪婪模式示例:

import re

Jier = 'yunweijia0909'
Suner = re.search('\d+', Jier)
print(Suner.group())

输出结果为:

0909

非贪婪模式示例:

import re

Jier = 'yunweijia0909'
Suner = re.search('\d+?', Jier)
print(Suner.group())

输出结果如下:

0

5、python找出所有满足条件的内容

方法:

findall

示例:

import re
Jier = 'yunweijia0909yunweijia0909yunweijia0909'
Suner = re.findall('\d+', Jier)
print(Suner)

输出结果如下:

['0909', '0909', '0909']

6、 python替换字符串

方法:

sub # 需要注意的是他不会修改源文件,只是进行修改之后的输出而已

示例:

import re
Jier = 'yunweijia0909yunweijia0909yunweijia0909'
Suner = re.sub('\d+', '0808', Jier)
print(Suner)
print(Jier)

输出结果如下:

yunweijia0808yunweijia0808yunweijia0808
yunweijia0909yunweijia0909yunweijia0909

7、python分割字符串

方法:

split

示例:

import re
Jier = 'yunweijia0909yunweijia0909yunweijia0909'
Suner = re.split('\d+', Jier)
print(Suner)
print(Jier)

输出结果如下:

['yunweijia', 'yunweijia', 'yunweijia', '']
yunweijia0909yunweijia0909yunweijia0909

8、python正则之预设正则表达式

方法:

compile
re.compile(pattern[, flags])
flags(可选):
 re.I 忽略大小写
 re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
 re.M 多行模式
 re.S 即为“.”‘并且包括换行符在内的任意字符(“.”不包括换行符)
 re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
 re.X 为了增加可读性,忽略空格和’ # ‘后面的注释

示例:

import re
Jier = 'yunweijia009yunweijia0909yunweijia0909'
Suner = re.compile(r"\d+ # 匹配多个数字", flags=re.X)
Finally = re.findall(Suner, Jier)
print(Finally)

输出结果如下:

['009', '0909', '0909']

9、python正则表达式小实验

(1)python匹配手机号码

手机号规则是:

第一位是1
第二位是3、4、5、8、7
一共为11位

示例:

import re

Jier = "My iphont is 15711236789"
Suner = re.search('1[34587]\d{9}', Jier)
print(Suner.group())

输出结果如下:

15711236789

(2)python匹配身份证号

身份证号规则是:

第一位1-9
后面5位数字0-9
年份:1或2开头,后面三位数字0-9
月份:两位数字0-9
日期:两位数字0-9
三位数字:0-9
最后一位:数字0-9,或者为x

示例:

import re

Jier = "399999199909091229"
Suner = re.search('\d\d{5}[1]\d{10}[\dxX]', Jier)
print(Suner.group())

输出结果如下:

399999199909091229

(3)python验证邮箱

邮箱规则就比较随意了,数字、字母都可以;

示例:

import re

Jier = "yunweijia0909@163.com"
Suner = re.match('\w+@\w+\.[a-zA-Z\.]+', Jier)
print(Suner.group())

输出结果如下:

yunweijia0909@163.com

至此,本文结束,相关内容每日更新。

更多内容请转至VX公众号 “运维家” ,获取最新文章。

------ “运维家” ------
------ “运维家” ------
------ “运维家” ------

linux系统下,mknodlinux,linux目录写权限,大白菜能安装linux吗,linux系统创建文件的方法,领克linux系统怎么装软件,linux文本定位;
ocr识别linux,linux锚定词尾,linux系统使用记录,u盘有linux镜像文件,应届生不会Linux,linux内核64位,linux自启动管理服务;
linux计算文件夹大小,linux设备名称有哪些,linux能用的虚拟机吗,linux系统进入不了命令行,如何创建kalilinux,linux跟so文件一样吗。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

运维家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值