个人博客地址:soliym.top
正则表达式
正则表达式也叫做匹配模式(Pattern),它由一组具有特定含义的字符串组成,通常用于匹配和替换文本
正则表达式(英语:Regular Expression、regex 或 regexp,缩写为 RE),也译为正规表示法、常规表示法,在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。
正则表达式这个概念最初是由 Unix 中的工具软件(例如 sed 和 grep)普及开的。
使用正则表达式
能很大程度的简化开发的复杂度和开发的效率,所以在 Python 中正则表达式在字符串的查
询匹配操作中占据很重要的地位
python中的re模块
为了方便对正则表达式的使用,python提供了re模块
导入模块:
Import re
查看re模块的方法和属性
dir(re)
['A', 'ASCII', 'DEBUG', 'DOTALL', 'I', 'IGNORECASE', 'L', 'LOCALE', 'M', 'MULTILINE', 'Match', 'Pattern', 'RegexFlag', 'S', 'Scanner', 'T', 'TEMPLATE', 'U', 'UNICODE', 'VERBOSE', 'X', '_MAXCACHE', '__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', '__version__', '_cache', '_compile', '_compile_repl', '_expand', '_locale', '_pickle', '_special_chars_map', '_subx', 'compile', 'copyreg', 'enum', 'error', 'escape', 'findall', 'finditer', 'fullmatch', 'functools', 'match', 'purge', 'search', 'split', 'sre_compile', 'sre_parse', 'sub', 'subn', 'template']
元字符
正则对到小写敏感,注意大小写
元字符 |
匹配内容 |
---|---|
. |
匹配除换行符以外的任意字符 |
\w |
匹配字母或数字或下划线 -python3中匹配各国语言符号 |
\s |
匹配任意的空白符 |
\d |
匹配数字 |
\n |
匹配一个换行符 |
\t |
匹配一个制表符 |
\b< |