正则表达式是Java、Php等编程语言中相当重要的一环,在实际应用程序代码中相当广泛,更是网络安全领域中不可或缺的一点。下面总讲一下正则表达式的基础知识以及相关应用
什么是正则表达式:正则表达式(regular expression,简写为regex)是一个字符串,用来描述匹配一个字符串集合的模式。 对于字符串处理来说,正则表达式是一个强大的工具,可以使用正则表达式来匹配、替换和拆分字符串。
匹配字符串
从string类的matches开始。
"Java is fun".matches("Java.*")
"Java is cool".matches("Java.*")
"Java is powerful".matches("Java.*")
这些语句中的"Java.*"是一个正则表达式。它描述了一个字符串模式,以Java开始,后面跟0个或者多个字符串。这里,子字符串.*匹配0或者多个任意字符。
正则表达式语法:
以下是一些比较常用的正则表达式:
注意:反斜杠是一个特殊字符,在字符串中开始转义序列Java中需要用\\d来表示\d;
单词字符是任何的字母,数字或者下划线字符;
不要在重复量词符中使用空白;
可以使用括号来将模式进行分组,例如,(ab){3}匹配ababab,但是ab{3}匹配abbba