基础:
1.正则
1.正则
1.1什么是正则表达式
正则表达式使用单个字符串来描述,匹配一系列符合某个句法规则的字符串。简单理解,就是对字符串的检索 匹配 和 处理。
Python通过re模块对正则表达式支持:
re.findall('正则表达式','字符串');
re.findall('正则表达式','字符串');
1.先将正则表达式的字符串形式编译为Pattern实例。(re.compile)
2.使用Pattern实例处理文本并获得匹配结果。(match、find、findall)
3.使用实例获得信息,进行其他操作。
compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。(运行速度快)
re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数(速度慢一些)
1.2正则表达匹配规则
正则表达式模式模式字符串使用特殊的语法来表示一个正则表达式:
字母和数字表示他们自身。一个正则表达式模式中的字母和数字匹配同样的字符串。
多数字母和数字前加一个反斜杠时会拥有不同的含义。
标点符号只有被转义时才匹配自身,否则它们表示特殊的含义。
反斜杠本身需要使用反斜杠转义。
由于正则表达式通常都包含反斜杠,所以你最好使用原始字符串来表示它们。模式元素(如 r'/t',等价于'//t')匹配相应的特殊字符。
下表列出了正则表达式模式语法中的特殊元素。如果你使用模式的同时提供了可选的标志参数,某些模式元素的含义会改变。
compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。(运行速度快)
进入python环境后
#Python通过re模块对正则表达式支持。
>>> import re
#先将正则表达式的字符串形式编译为Pattern实例
>>> Pattern = re.compile('hello')
#使用Pattern实例处理文本并获得匹配结果。
>>>
#使用实例获得信息,进行其他操作。
>>> print match.group()
hello
re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数(速度慢一些)
>>> word = re.findall(‘hello’,’hello,word!’)
>>> word
[‘hello’]
1.2正则表达匹配规则
正则表达式模式模式字符串使用特殊的语法来表示一个正则表达式:
字母和数字表示他们自身。一个正则表达式模式中的字母和数字匹配同样的字符串。
多数字母和数字前加一个反斜杠时会拥有不同的含义。
标点符号只有被转义时才匹配自身,否则它们表示特殊的含义。
反斜杠本身需要使用反斜杠转义。
由于正则表达式通常都包含反斜杠,所以你最好使用原始字符串来表示它们。模式元素(如 r'/t',等价于'//t')匹配相应的特殊字符。
下表列出了正则表达式模式语法中的特殊元素。如果你使用模式的同时提供了可选的标志参数,某些模式元素的含义会改变。