正则表达式 是一种匹配输入文本的模式。.Net 框架提供了允许这种匹配的正则表达式引擎。模式由一个或多个字符、运算符和结构组成
用于定义正则表达式的各种类别的字符、运算符和结构:
• 字符转义:正则表达式中的反斜杠字符(\)指示其后跟的字符是特殊字符,或应按原义解释该字符
• 字符类:字符类与一组字符中的任何一个字符匹配
• 定位点:定位点或原子零宽度断言会使匹配成功或失败,具体取决于字符串中的当前位置,但它们不会使引擎在字符串中前进或使用字符
• 分组构造:分组构造描述了正则表达式的子表达式,通常用于捕获输入字符串的子字符串
• 反向引用构造:反向引用允许在同一正则表达式中随后标识以前匹配的子表达式
字符转义:
\a 与报警 (bell) 符 \u0007 匹配
\b 在字符类中,与退格键 \u0008 匹配
\t 与制表符 \u0009 匹配
\r 与回车符 \u000D 匹配(\r 与换行符 \n 不是等效的。)
\v 与垂直制表符 \u000B 匹配
\f 与换页符 \u000C 匹配
\n 与换行符 \u000A 匹配
\e 与转义符 \u001B 匹配
\ nnn 使用八进制表示形式指定一个字符(nnn 由二到三位数字组成)
\x nn 使用十六进制表示形式指定字符(nn 恰好由两位数字组成)
\c X \c x 匹配 X 或 x 指定的 ASCII 控件字符,其中 X 或 x 是控件字符的字母
\u nnnn 使用十六进制表示形式匹配一个 Unicode 字符(由 nnnn 表示的四位数)
\ 在后面带有不识别的转义字符时,与该字符匹配
字符类:
[character_group] 匹配 character_group 中的任何单个字符。 默认情况下,匹配区分大小写
[^character_group] 非:与不在 character_group 中的任何单个字符匹配。 默认情况下,character_group 中的字符区分大小写
[ first - last ] 字符范围:与从 first 到 last 的范围中的任何单个字符匹配
. 通配符:与除 \n 之外的任何单个字符匹配,若要匹配原意句点字符(. 或 \u002E),您必须在该字符前面加上转义符 (.)
\p{ name } 与 name 指定的 Unicode 通用类别或命名块中的任何单个字符匹配
\P{ name } 与不在 name 指定的 Unicode 通用类别或命名块中的任何单个字符匹配
\w 与任何单词字符匹配
\W 与任何非单词字符匹配
\s 与任何空白字符匹配
\S 与任何非空白字符匹配
\d 与任何十进制数字匹配
\D 匹配不是十进制数的任意字符
定位点:
分组构造:
反向引用构造:
Regex 类:Regex 类用于表示一个正则表达式
public bool IsMatch( string input ) : 指示 Regex 构造函数中指定的正则表达式是否在指定的输入字符串中找到匹配项
public bool IsMatch( string input, int startat ):指示 Regex 构造函数中指定的正则表达式是否在指定的输入字符串中找到匹配项,从字符串中指定的开始位置开始
public static bool IsMatch( string input, string pattern ) :指示指定的正则表达式是否在指定的输入字符串中找到匹配项
C# 正则表达式
最新推荐文章于 2024-08-21 19:30:21 发布