程序员必须掌握的基本正则表达式_正则表达式说明：gr(a|e)y-CSDN博客

本文链接：https://blog.csdn.net/Labber/article/details/2180238

　　正则表达式的工作方式就象windows或者*nix系统里面的文件名替代符 - 你可以使用特定的*或者?来指定一系列文件。但是使用正则表达式的特殊字符或者metacharacters(元字符)来表示这类事情会更准确。

　　如果我们联合使用这两个行定位点字符，我们可以搜索在多行文字中寻找包含的特殊字符串序列。比如：表达式 ^mike$ 将只会匹配占有单独一行的单词mike，一个字不多一个字不少。同样，表达式 ^$ 对于发现空行(一行开始就是本行结束的那种)很有用。

　　一对方括号被称为一个字符分类, 你可以用来匹配任何一个或多个字符。假设你想匹配单词 ‘gray’，同时也想找一下被拼写成 ‘grey’的单词。使用一个字符分类将允许你匹配这两者 -- 正则表达式 gr[ea]y 被解读成 “匹配这样的字符串 - 一个g, 跟着是r, 跟着或者是一个e或者是一个a, 跟着一个y”。

　　但是且慢，我看到有人举手质疑。假如在一个字符分类里面，’-’字符做为第一个字符出现的时候，会把它认为成什么呢?比如[-a-f]，问题很好，注意：这是一个例外，如果在字符分类中，’-’字符是第一个出现的字符，那我们把它当作普通字符而不是元字符处理(因为实际上它不可能表示一个字符范围，范围需要有开始和结束字符)，这个时候它只会匹配一个普通的’-’字符。引申开来，我们再说一个例外：s’?’和’.’在大多数情况下都是正则表达式的元字符，但是有个例外是在字符分类中，当它们在字符分类中的时候(比如在：[-0-9.?]，它们只是代表一个普通字符，唯一的特殊字符(元字符)是0和9中间的’-’)。

　　‘.’ 元字符(一般读成a dot 或者point)是一种匹配任何字符的写法。在你想在一个字符串的指定位置匹配一个任意字符的时候，它显得非常可爱。再强调一遍，在字符分类中，’.’就不是一个元字符了。到现在为止，你开始看出一些门道来了吧?哪些是元字符哪些不是元字符在字符分类里面和外面是不一样的。

　　‘|’ 元字符(读成pipe)的意思是“or”。它允许你把多个表达式合成到一个表达式，然后匹配里面任何单个表达式的结果。这些子表达式被称为备选项。