Python正则表达式

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,来筛选出符合这个规则的内容。

可以简单理解为:一个强大的搜索工具中,正则表达式就是你要搜索内容的条件表达式。

1. re.findall()函数

作用:遍历整个字符串,可以获取其中所有匹配的字符串,返回一个列表。

一般用法:

re.findall(r'正则表达式''要匹配的文本')

2. 从小练习接触正则

  1. 从字符串中匹配单词to:
import re  
text = "0537-146987425,0537-299656897,The moment you think about giving up,think of the reason why you held on so long. Total umbrella for someone else if he, you’re just not for him in the rain.Never put your happiness in someone else’s hands.Sometimes you have to give up on someone in order to respect yourself. aaaa bbbbcc d dddddd"  
print(re.findall(r'to',text))  
  • 输出:
['to', 'to']
  1. 匹配在text中以g开头的所有单词:
print(re.findall(r'\bg\w*?\b',text))  
  • 输出:
['giving', 'give']
  1. 查找字母长度为4的单词:
print(re.findall(r'\b\w{4}\b',text))  
  • 输出:
['0537', '0537', 'held', 'long', 'else', 'just', 'rain', 'your', 'else', 'have', 'give', 'aaaa']
  1. 查找出xxxx-xxxxxxxxx格式的数据:
print(re.findall(r'\d{4}-\d{8}',text))  
  • 输出:
['0537-14698742', '0537-29965689']

3. 正则表达式元字符

元字符功能说明
^匹配字符串的开始
$匹配字符串的结束
.匹配除换行符以外的任意字符
\d匹配数字
\b匹配单词头或单词尾
\w匹配任何字母、数字以及下划线
\s匹配任何空白字符,包括空格、制表符、换页符
\B与\b相反,匹配非单词边界
\W与\w相反
\S与\s相反
{m,n}{}前的字符或子模式重复至少m次,至多n次
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小廖同志_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值