正则表达式定义
正则表达式,又称正规表达式、常规表达式
使用字符串来描述、匹配一系列符合某个规则的字符串
简单来说,是一种匹配字符串的方法,通过一些特殊符号,实现快速查找、删除、替换某个特定字符串。
正则表达式组成
普通字符:大小写字母、数字、标点符号及一些其他符号
元字符:在正则表达式中具有特殊意义的专用字符
Linux中文本处理工具
支持基础正则表达式:grep;sed
支持扩展正则表达式:egrep;awk
基础正则表达式元字符
基础正则表达式是常用的正则表达式部分
除了普通字符外,常见到以下元字符
■ \ :转义字符,\!、 \n等 #让特殊意义的元字符作普通字符使用
■ ^ :匹配字符串开始的位置
例: ^a、 ^the、 ^#
■ $ :匹配字符串结束的位置
例: word$
■ . :匹配除\n之外的任意的一个字符
例