目录
1. 正则表达式简介
正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。
为什么要使用正则表达式?
典型的搜索和替换操作要求您提供与预期的搜索结果匹配的确切文本。虽然这种技术对于对静态文本执行简单搜索和替换任务可能已经足够了,但它缺乏灵活性,若采用这种方法搜索动态文本,即使不是不可能,至少也会变得很困难。
-
测试字符串内的模式
-
替换文本
-
于模式匹配从字符串中提取子字符串
2. 正则表达式语法
2.1 普通字符
普通字符包括没有显式指定为元字符的所有可打印和不可打印字符。这包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。
-
[A-Z] 表示一个区间,匹配所有大写字母,[a-z] 表示所有小写字母.
-
[...]表示匹配 [...] 中的所有字符,例如 [aeiou] 匹配字符串 "google runoob taobao" 中所有的 e o u a 字母。
-
匹配除了 [^...] 中字符的所有字符,例如 [^aeiou] 匹配字符串 "google runoob taobao" 中除了 e o u a 字母的所有字母.
-
.:匹配除换行符(\n、\r)之外的任何单个字符,相等于 [^\n\r]。
-
[\s\S]:匹配所有。\s 是匹配所有空白符,包括换行,\S 非空白符,不包括换行。
-
\w:匹配字母、数字、下划线。等价于 [A-Za-z0-9_]