2016/1/28学习内容
第四章 Python字符串与正则表达式之正则表达式
正则表达式是字符串处理的有力工具和技术,正则表达式使用预定义的特定模式去匹配一类具有共同特征的字符串,主要用于字符串处理,可以快速,准确地完成复杂的查找,替换等处理要求。
Python中,re模块提供了正则表达式操作所需要的基本功能
正则表达式元字符
元字符: .
匹配除换行符意外的任意单个字符
元字符: *
匹配位于*之前的0个或多个字符
元字符: +
匹配位于+之前的1个或多个字符
元字符: |
匹配位于|之前或之后的字符
元字符: ^
匹配行首,匹配以^后面的字符开头的字符串
元字符: $
匹配行尾,匹配以$之前的字符结束的字符串
元字符: ?
匹配位于?之前的0个或1个字符
元字符: \
表示位于\之后的为转义字符
元字符: []
匹配位于[]中的任意一个字符
元字符: -
用在[]之内用来表示范围
元字符:()
将位于()内的内容作为一个整体对待
元字符: {}
按{}中的次数进行匹配
元字符: \b \B
匹配单词头或单词尾 \\不明意义
非单词头,单词尾
元字符: \d \D
匹配任何数字 相当于[0-9]
相反
元字符: \s \S
匹配任何空白字符
相反
元字符: \w \W
匹配任何字母,数字,下划线,相当于[a-zA-Z0-9_]
相反
- 如果原字符串中有\d出现,想查找它,需要在正则中用\\\d
- 如果原子符串中有+[]等符号出现,想查找他,需要在正则前加一个\即可