关闭

正则表达式

标签: 正则表达式语言regex
205人阅读 评论(0) 收藏 举报
分类:

⑴正则表达式是由普通字符特殊字符(又称元字符)组成的文字模式(pattern)。

①普通字符包括:打印字符(用于文本输出)和非打印字符(用于文本控制)。他们都是文本中所固有的字符(除去元字符)。 ②元字符:含有特殊含义的字符。相当于文字模式(pattern)中的操作符。来源:元字符取自于普通字符【毕竟字符是有限的,只能从普通字符中取材】,并赋予元字符各自特殊的含义,除非显示用‘\’给元字符降义才能变成普通字符【要回到本来面目,得声明】。

⑵理解‘\’符号是重中之重,它有以下多种意思:

①转义,即声明普通符号;

②声明普通符号中的非打印字符;

③引用已匹配的字符缓存【见(pattern)】;

④八进制转义符。 ⑶速记法则:等效。参考百度百科:正则表达式 ⑷语言区别:

①其他语言中(非java语言),‘\\’表示“我想要在正则表达式中插入一个普通的(字面上的)反斜线,请不要给他任何特殊的意义”;

②java中,‘\\’表示“我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义”。【‘\’是将普通字符转为元字符。】然而这只是在java层次的处理,其处理后还是转为标准的regex。 即:   

Java -------------------- Regex

若运行时获取pattern则可以规避被编译的风险。即运行时的pattern可以根据Regex的本来语法来书写。

参考《think in java》第四版 13.6节案例的区别:即使用控制台输入pattern和在代码中显式给出pattern的区别。

⑸参考资料:

①百度百科:正则表达式

正则表达式教程chm完整版

③《think in java》第四版 13.6 正则表达式

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:4320次
    • 积分:171
    • 等级:
    • 排名:千里之外
    • 原创:13篇
    • 转载:1篇
    • 译文:0篇
    • 评论:0条