一、正则表达式简介
1、正则表达式,(Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”),在使用单个字符串来描述、匹配一系列或匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式(规则)的文本。
2、正则表达式,是描述匹配模式(pattern)的文本字符串,用于搜索和匹配字符串集。正则表达式于40年代出现,用于描述常规语言,但直到70年代才出现在编程中,由肯·汤普逊编写的QED文字编辑器是编程中找到最早使用正则表达式的地方。
二、常见的匹配字符和规则
1、\d:匹配0~9数字
2、\s:匹配任意空白符号(tab、空格、换行等)
3、.:匹配任意字符
4、*:匹配任意字符任意多次
5、?:匹配0次或1次
6、+:匹配1次或多次
7、{m,n}重复m次到n次,{m}重复m次
三、Python中的正则:
1、引入模块:import re
2、re.match:在目标文本的开头进行匹配。
3、re.findall:扫描整个目标文本,返回所有与规则匹配的子串组成的列表。
4、re.sub:将与规则匹配的字符串替换成其它文本
5、re.split:从与规则匹配的子串进行切割,返回切割后子串组成的列表。
四、小结
正则表达式在许多场合中都有非常重要的应用,例如搜索、爬虫等。本文也只是简单介绍 一下正则表达式,抛砖引玉。希望对大家有帮助!