正则表达式

最新推荐文章于 2024-05-20 10:35:51 发布

hddzdd

最新推荐文章于 2024-05-20 10:35:51 发布

阅读量82

点赞数

分类专栏： Python 学习

本文链接：https://blog.csdn.net/hddzdd/article/details/89844942

版权

Python 学习专栏收录该内容

19 篇文章 0 订阅

订阅专栏

#!/usr/bin/env python
# -*- coding:utf-8 -*-

# 为什么要有正则表达式？
# 匹配字符串
# 一个人的电话号码
# 一个人的身份证号
# 一台机器的ip地址
# 表单验证
# 验证用户输入的信息是否准确
# 11位全数字 1开头第二个数3-9之外的数
# 银行卡号
# 爬虫
# 从网页源码中获取一些链接、重要数据

# 正则规则（元字符，量词）
# 第一条规则：本身是哪一个字符，就匹配字符串中的哪一个字符
# 第二条规则：字符组[字符1字符2]，一个字符组就代表匹配一个字符，只要这个字符出现在字符组里，那么就说明这个字符能匹配上
# 字符组中还可以使用范围
# 所有的范围都必须遵循ascii码从下到大来指定
# [0-9] [a-z] [A-Z]
# [0-9] \d 表示所有的数字
# d --> d
# \d --> \是转义符转义符转义了d，让d能够匹配所有0-9之间的数
# \w 表示大小写字母数字下划线
# \s 表示空白空格换行符制表符
# \t 匹配制表符
# \n 匹配换行符
# \D 表示所有的非数字
# \W 表示除数字字母下划线之外的所有字符
# \S 表示非空白
# . 表示除了换行符之外的任意内容
# [] 字符组：只要在中括号内的所有字符都是符合规则的字符
# [^ ]非字符组：只要在中括号内的所有字符都是不符合规则的字符
# [] [^]
# ^ 表示一个字符的开始
# $ 表示一个字符的结束
# | 表示或，注意，如果两个规则有重叠部分，总是长的在前面，短的在后面
# () 表示分组，给一部分正则规定为一组，|这个符号的作用域就可以缩小了
# [\d] [0-9] \d 没有区别都是要匹配一位数字
# [\d\D] [\W\w] [\S\s] 匹配所有一切字符