正则表达式

什么是正则表达式

正则表达式,又称规则表达式**,**(Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式(规则)的文本。

为什么要使用正则表达式

给定一个正则表达式和另一个字符串,我们可以达到如下的目的:

  1. 判断给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”):

  2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。

关于正则表达式

正则表达式的特点

  1. 灵活性、逻辑性和功能性非常强;

  2. 可以迅速地用极简单的方式达到字符串的复杂控制。

  3. 对于刚接触的人来说,比较晦涩难懂。

正则表达式的语法

正则表达式语法:使用元字符进行排列组合来匹配字符

元字符:具有固定含义的特殊符号

常用元字符

  1. . 匹配除换行符以外的的任意字符
  2. \w 匹配字母或数字或下划线
  3. \s 匹配任意的空白符
  4. \d 匹配数字
  5. \n 匹配一个换行符
  6. \t 匹配一个制表符
  7. ^ 匹配字符串的开始
  8. $ 匹配字符串的结尾
  9. \w 匹配非字母或数字下划线
  10. \D 匹配非数字
  11. \S 匹配非空白符
  12. a|b 匹配字符a或b
  13. () 匹配括号内的表达式,也表示一个组
  14. […] 匹配字符组中的字符
  15. [^…] 匹配除了字符组中字符的所有字符
量词:控制前面的元字符出现的字符
  1. *重复零次或更多次
  2. + 重复一次或更多次
  3. ?重复一次或零次
  4. {n} 重复n次
  5. {n, } 重复n次或更多次
  6. {n,m} 重复n到m次
贪婪匹配和惰性匹配
  1. .* 贪婪匹配
  2. .*? 惰性匹配

爬虫中多使用惰性匹配

示例代码

class Verify(object):

# 验证手机号

def phone(self,yphone):

phone_pat = re.compile('^1([34578]\d|4[57]|5[0-35-9]|7[06-8]|8[89])\d{8}$')

res = re.search(phone_pat, yphone)

return True if reselse False

#验证邮箱

def email(self,yemail):

str =r'^[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+){0,4}@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+){0,4}$'

return True if re.match(str, yemail)else False

#验证身份证

def idCard(self,cardId):

str =r'(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)'

return True if re.match(str, cardId)else False


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小小猿--

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值