正则表达式

原创 2015年11月18日 14:50:36

⑴正则表达式是由普通字符特殊字符(又称元字符)组成的文字模式(pattern)。

①普通字符包括:打印字符(用于文本输出)和非打印字符(用于文本控制)。他们都是文本中所固有的字符(除去元字符)。 ②元字符:含有特殊含义的字符。相当于文字模式(pattern)中的操作符。来源:元字符取自于普通字符【毕竟字符是有限的,只能从普通字符中取材】,并赋予元字符各自特殊的含义,除非显示用‘\’给元字符降义才能变成普通字符【要回到本来面目,得声明】。

⑵理解‘\’符号是重中之重,它有以下多种意思:

①转义,即声明普通符号;

②声明普通符号中的非打印字符;

③引用已匹配的字符缓存【见(pattern)】;

④八进制转义符。 ⑶速记法则:等效。参考百度百科:正则表达式 ⑷语言区别:

①其他语言中(非java语言),‘\\’表示“我想要在正则表达式中插入一个普通的(字面上的)反斜线,请不要给他任何特殊的意义”;

②java中,‘\\’表示“我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义”。【‘\’是将普通字符转为元字符。】然而这只是在java层次的处理,其处理后还是转为标准的regex。 即:   

Java -------------------- Regex

若运行时获取pattern则可以规避被编译的风险。即运行时的pattern可以根据Regex的本来语法来书写。

参考《think in java》第四版 13.6节案例的区别:即使用控制台输入pattern和在代码中显式给出pattern的区别。

⑸参考资料:

①百度百科:正则表达式

正则表达式教程chm完整版

③《think in java》第四版 13.6 正则表达式

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/q99261581/article/details/49907081
收藏助手
不良信息举报
您举报文章:正则表达式
举报原因:
原因补充:

(最多只允许输入30个字)