1. Bash中的通配符
2. 正规表示法
一种通用的字符串处理方式,工具支持正规表示法的即可用此来处理文本,如vi,grep,awk,sed
*语系对正规表示法的影响,档案记录的都是0或1,通过不同的编码表示出来,不同语系的编码结果不同,
造成最后处理截取,搜寻等结果不同
基础正则表示法的用法列表
grep -n 't[ae]st' regular_express.txt
grep -n '[^g]oo' regular_express.txt [^]代表非
grep -n '[^a-z]oo' regular_express.txt
grep -n '[^[:lower:]]oo' regular_express.txt
grep -n '[0-9]' regular_express.txt
grep -n '[[:digit:]]' regular_express.txt [:digit:] 代表【0-9】
[a-z] [A-Z] [0-9]表示连续的字符组===》[a-zA-Z0-9]
表示连续的范围内的选值用-
行首、行尾字符 ^ $
grep -n '^the' regular_express.txt
grep -n '^[[:lower:]]' regular_express.txt
grep -n '^[^[:alpha:]]' regular_express.txt
grep -n '^[^a-zA-Z]' regular_express.txt
grep -n '\.$' regular_express.txt #行尾是小数点,小数点是特殊字符\来跳脱原来的含义
grep -n '^$' regular_express.txt #空白行
grep -v '^$' /etc/syslog.conf | grep -v '^#'
. (小数点):代表『一定有一个任意字符』的意思;
* (星星号):代表『重复前一个 0 到无穷多次』的意思,为组合形态
oo*(一个o以上)
ooo*(两个o以上)
『g.*g』的作法,
因为 * 可以是 0 或多个重复前面的字符,而 . 是任意字符,所以: 『.* 就代表零个或多个任意字符』
『任意数字』的行列
‘[0-9][0-9]*’[0-9]仅代表了一个位上有数字
限定“连续 RE" 字符范围 {}
grep -n 'o\{2\}' regular_express.txt
grep -n 'go\{2,5\}g' regular_express.txt # 2到5个o
grep -n 'go\{2,\}g' regular_express.txt # 两个及以上的o