1、前言
给你一行复杂的串字符,你想提取你想要的字段,一般的split()的方法很难做到时,就会用到正则表达式。正则表达式(RE)是含有文本和特殊字符的字符串。
不含特殊符号时,正则表达式它仅匹配自身:
正则表达式 匹配的字符串
python python
hello hello
666 666
2、正则表达式的字符
这么多看着有点头晕吧,先大致浏览一遍,咱们再一一介绍。
2.1 通配符(.)
点字符(.)可以匹配除换行符(\n)以外的任何字符。有一点需要注意,是匹配单个字符!!!
正则表达式 匹配的字符串
.python 例如:cpython, 3python,*python
如果想匹配多个字符,那怎么办呢?就要用到特殊字符
* * 前的字符出现的次数大于等于0(≥0)
+ + 前的字符出现的次数大于等于1(≥1)
? ? 前的字符出0次或1次(可有可无)
来个栗子:
正则表达式 匹配的字符串