字符集合只能匹配特定的字符和字符区间
1、匹配多个指定字符中的某一个
可以使用元字符“[”和“]”来定义一个字符集合。在使用[和]定义的字符集合里,这两个元字符之间的所有字符都是该集合的组成部分,
(1)字符集合的匹配结果是能够与该集合里的任意一个成员相匹配的文本。
例如:[ns]a.\.xls 匹配 na1.xls na2.xls sa1.xls sam.xls
(2)字符集合一般用于不需要区分大小写(或者是只须匹配某个特定部分)的搜索操作。例如:[Rr]eg[Ee]x 匹配 RegEx or regex
2、利用字符集合区间
字符区间可以用-(连字符)来定义(“-”只在[]中是元字符,而在字符集合)
ex:[ns]a[0-9]\.xls 匹配 na1.xls na2.xls sa1.xls
其中的[0-9]与[0123456789]完全等价
合法的字符区间形式:[0-9], [A-Z],[A-z]
字符区间的首、尾字符可以是ASCII字符表里的任意字符,
最常用的是数字和字母字符区间。
注意:一定要避免让一个区间的尾字符小于它的首字符
‘-’(连字符)作为一个特殊的元字符,只能用在[和]之间,在其他地方,’-’只是一个普通字符
在同一个字符集合中可以给出多个字符区间,ex:[A-Za-z0-9]
3、取非匹配
用元字符’^’实现除了指定字符集合里的字符,其他字符都可以匹配。
ex : [^0-9]
效果范围是作用于指定字符集合里的所有字符区间
4、总结
元字符‘[‘和‘ ]‘用来定义一个字符集合。
字符集合两种定义法:(1)列出所有的 (2)利用元字符’-’
可以使用’^’对整个指定字符集合取非