正则表达式的实际应用
从上一篇博客的正则表达式的一些规则和特性,很明显可以看出正则表达式善于描述与语言有关的内容。下面介绍一下我了解到的正则表达式的实际应用。
1.字符串查找
如果文本包含在给定正则表达式所描述的字符串集合中,就说文本和模式相匹配,正则表达式的模式匹配一般化了子字符串查找问题。
举个例子,要在一段文本中查找子字符串pat,就检查文本是否存在于模式“.*pat.*”所描述的语言之中。
2.合法性检查
我们查查会遇到需要检查输入合法性的问题,一个比较好的解决方式就是用正则表达式来描述所有合法的输入,从而将检查合法性问题转化为了模式匹配问题——如果输入的字符串在正则表达式所描述的语言当中,那么这个输入就是合法的。
正则表达式 | 匹配 |
---|---|
.*NEEDLE.* | 含有NEEDLE是字符串 |
gcg(cgg | agg)*ctg | gcgaggaggcggcggctg |
3.基因组
生物学家也会用正则表达式来研究重要的科学问题。
比如人类的基因序列的某个区域可以用正则表达式gcg(cgg)*ctg,其中模式cgg的重复次数在不同个体间有较大差异,由此可用来检查某些遗传病。
4.搜索
互联网搜索引擎都支持正则表达式,但可能不是非常完整。
5.正则表达式
正则表达式的特殊性质使得它有很多特性等待我们挖掘。
比如正则表达式可以实现取余操作:例如(0|1(01*0)*1)*描述的所有有0和1组成的字符串都是3的倍数的二进制表示。
之后我又了解了一下,发现正则表达式和形式语言与自动机这门课有比较多的联系,那在学习这门课的时候在深入啦。