正则表达式
正则表达式是一种用于模式匹配和替换的强有力的工具,它由一系列普通字符和特殊字符组成,能明确描述文本字符的文字匹配模式。几乎所有的编程语言和文本编辑工具都支持正则表达式。
什么是正则表达式
正则表达式是一种描述字符串结构的语法规则,是一个特定的格式化模式,可以匹配、替换、截取匹配的字符串。
学习正则表达式之前,先来了解几个易混淆的术语,这对于正则表达式的学习将有很大帮助。
☑ grep:最初是ED编辑器中的一条命令,用来显示文件中的特定内容,后来成为一个独立的工具。
☑ egrep:grep虽然不断地更新升级,但仍然无法跟上技术的脚步。为此,贝尔实验室推出了egrep,意为“扩展的grep”,大大增强了正则表达式的能力。
☑ POSIX(Portable Operating System Interface of Unix):可移植操作系统接口。在grep发展的同时,另有一些开发人员也按照自己的喜好开发出了具有独特风格的版本。但问题也随之而来,有的程序支持某个元字符,而有的程序则不支持,因此就有了POSIX。POSIX是一系列标准,确保了操作系统之间的可移植性。但POSIX和SQL一样,没有成为最终的标准,而只能作为一个参考。
☑ Perl(Practical Extraction and Reporting Language):实际抽取与汇报语言。1987年,Larry Wall发布了Perl。最终,Perl成为POSIX之后的另一个标准。