2020-10-14

写在前面:

python的re模块中有3个方法

  • search(pattern, string, flags=0),在string中查找匹配pattern的字串,找到一个就会返回一个match对象,可以直接print返回的结果,也可以使用groups()来查看分组的情况。若是没有找到匹配,返回None。

  • match(pattern, string, flags=0),查看string的开头部分是否匹配pattern,匹配的化就把匹配结果返回,也是一个match对象。若是没有找到匹配,返回None。

  • matchall(pattern, string, flags=0),查看整个string是否匹配pattern,返回的情况和match方法是一样的

注意:

  • Python中正则表达式由re模块提供所需要的功能

  • 在字符串前面加了r,表示对字符串不进行转义

常用的正则表达式元字符:

\w匹配字母,数字,下划线
\W匹配非字母,数字,下划线
\s匹配任意空白字符
\S匹配任意非空字符
\d匹配任意数字
\D匹配任意非数字
\A匹配字符串开头
^匹配开始
$匹配结尾
.匹配任意字符除\n
[…]用来表示一组字符
[^…]不在[]中的字符
*匹配0个或多个
+一个或多个
?匹配前面0个或一个
{n}n个前面的字符串
{n,m}前面出现n到m次
a|b匹配a或b
()匹配()内的表达式
\b单词开头
\B非单词边界

 

常用的正则表达式总结:



非负整数:^\d+$
 
正整数:^[0-9]*[1-9][0-9]*$
 
非正整数:^((-\d+)|(0+))$
 
负整数:^-[0-9]*[1-9][0-9]*$
 
整数:^-?\d+$
 
非负浮点数:^\d+(\.\d+)?$
 
正浮点数 : ^((0-9)+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)$
 
非正浮点数:^((-\d+\.\d+)?)|(0+(\.0+)?))$
 
负浮点数:^(-((正浮点数正则式)))$
 
英文字符串:^[A-Za-z]+$
 
英文大写串:^[A-Z]+$
 
英文小写串:^[a-z]+$
 
英文字符数字串:^[A-Za-z0-9]+$
 
英数字加下划线串:^\w+$
 
E-mail地址:^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$
 
URL:^[a-zA-Z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\s*)?$ 
 或:^http:\/\/[A-Za-z0-9]+\.[A-Za-z0-9]+[\/=\?%\-&_~`@[\]\':+!]*([^<>\"\"])*$
 
邮政编码:^[1-9]\d{5}$
 
中文:^[\u0391-\uFFE5]+$
 
电话号码:^((\d2,3\d2,3)|(\d{3}\-))?(0\d2,30\d2,3|0\d{2,3}-)?[1-9]\d{6,7}(\-\d{1,4})?$
 
手机号码:^((\d2,3\d2,3)|(\d{3}\-))?13\d{9}$
 
双字节字符(包括汉字在内):^\x00-\xff
 
匹配首尾空格:(^\s*)|(\s*$)(像vbscript那样的trim函数)
 
匹配HTML标记:<(.*)>.*<\/\1>|<(.*) \/>
 
匹配空行:\n[\s| ]*\r
 
提取信息中的网络链接:(h|H)(r|R)(e|E)(f|F)  *=  *('|")?(\w|\\|\/|\.)+('|"|  *|>)?
 
提取信息中的邮件地址:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
 
提取信息中的图片链接:(s|S)(r|R)(c|C)  *=  *('|")?(\w|\\|\/|\.)+('|"|  *|>)?
 
提取信息中的IP地址:(\d+)\.(\d+)\.(\d+)\.(\d+)
 
提取信息中的中国手机号码:(86)*0*13\d{9}
 
提取信息中的中国固定电话号码:(\d3,4\d3,4|\d{3,4}-|\s)?\d{8}
 
提取信息中的中国电话号码(包括移动和固定电话):(\d3,4\d3,4|\d{3,4}-|\s)?\d{7,14}
 
提取信息中的中国邮政编码:[1-9]{1}(\d+){5}
 
提取信息中的浮点数(即小数):(-?\d*)\.?\d+
 
提取信息中的任何数字 :(-?\d*)(\.\d+)? 
 
IP:(\d+)\.(\d+)\.(\d+)\.(\d+)
 
电话区号:/^0\d{2,3}$/
 
腾讯QQ号:^[1-9]*[1-9][0-9]*$
 
帐号(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
 
中文、英文、数字及下划线:^[\u4e00-\u9fa5_a-zA-Z0-9]+$
 
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
 
匹配双字节字符(包括汉字在内):[^\x00-\xff]
 
匹配空行的正则表达式:\n[\s| ]*\r
 
匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
 
sql语句:^(select|drop|delete|create|update|insert).*$
 
匹配首尾空格的正则表达式:(^\s*)|(\s*$)
 
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值