正则表达式-简介
正则表达式是一种特殊的字符串模式,用于匹配一组字符串,就好比用模具,定义一种规则去匹配符合规则的字符。
正则表达式(Regular Expression)是一种文本模式,包括普通字符(列如,a到z之间的字母)和特殊字符(称为“元字符”)。正则表达式使用单个字符串来描述,匹配一系列匹配某个句法规则的字符串。
正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串,将匹配的字串替换或者从某个串中取 出符合某个条件的字串等。
runoo+b,可以匹配runoob,runoooooob等,+号代表前面的字符必须至少出现一次(1次或多次)。
runoo*b,可以匹配runob,runoooooob等,*号代表字符可以不出现,也可以出现一次或多次(0次,或1次,或多次)
colou?r,可以匹配color或者colour,?问号代表前面的字符最多只可以出现一次(0次或者1次)。
构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式。正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。
正则表达式-运算符优先级
正则表达式从左到右进行计算,并遵循优先顺序,这与算术表达式非常类似。
相同优先级的从左到右进行计算,不同优先级的运算先高后低。
匹配规则
基本模式匹配
一切从最基本的开始。模式,是正则表达式最基本的元素,它们是一组描述字符串特征的字符。模式可以很简单,由普通的字符串组成,也可以非常复杂,往往用特殊的字符表示一个范围内的字符、重复出现,或表示上下文。