立即学习:https://edu.csdn.net/course/play/6861/326748?utm_source=blogtoedu
源字符
指代直接存在于字符串内部的子串
#提取出字符串中的python子串
s1=“通过几天的学习python,我感觉自己python 进步了不少”
list = re.findall("python",s1)
英文状态的句号点.
指代任意字符,(数字,字母,标点符号,汉字),除去\n换行符,类似linux中的*
#提取出动力总成的值
import re
s2="此次新朗逸主要搭配了1.5L和1.5T两种动力总成的发动机,别克英朗则搭载了1.0T和1.3T的动力总成"
#re.findall("1...",s2)
re.findall("1\...",s2)
\. 就是.本身,而不再代表anything
反斜杠\
表示转义字符,用于转换含义的字符
\n:指定换行
\t 指定tab制表符号
\d:指代0-9中的额任意数字
\s 指代任意一种空白(空格 \tab\ 换行)
\w 指代字母、数字和下划线的任意一种
\. 指代句号本身
\\ 指代斜杠本身\
#剔除字符串中所有的空白
s3=‘ 距离2019年北京马拉松开跑只有两周的时间了,\n 今年的北京马拉松预报名人数超过了16万人,\t媒体公布的中签率只有16%左右,再创历年来的新低’
print(s3)
re.sub("\s",s3)
英文状态中中括号[]
指代字符集合,当需要特定的字符串匹配时们可以选择中括号