正则表达式
正则表达式是什么
正则表达式是用于描述字符排列和匹配模式的一种语法规则。
它主要用于字符串的模式分割、匹配、查找以及替换。
正则表达式与通配符
1.正则表达式用来在文件中匹配符号条件的字符串,正则是包含匹配。grep、awk、sed等命令可以支持正则表达式。
2.通配符用来陪陪符合条件的文件名,通配符是完全匹配。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配了。
通配符
* //匹配任意内容
? //匹配任意一个内容
[] //匹配中括号中的一个字符
3.基础正则表达式
字符截取命令
1、cut字段提取命令
cut [选项] 文件名
-f 列号:提取第几列
-d 分割符:按照制定分割符分割列
cut -d ":" -f 1,3 /etc/passwd
2、printf命令
printf '输出类型输出格式' 输出内容
输出类型
- %ns: 输出字符串。n是数字指代输出几个字符
- %ni: 输出整数。n是数字指代输出几个数字
- %m.nf: 输出浮点数。m和n是数字,指代输出的整数位数和小数位数如%8.2f代表共输出8位数,其中2位是小数,6位是整数。
输出格式
- \a: 输出警告声音
- \b: 输出退格键,也就是Backspace键
- \f: 清除屏幕
- \n: 换行
- \r: 回车,也就是说Enter键
- \t: 水平输出退格键,也就是Tab键
- \v: 垂直输出退格键,也就是Tab键
3、awk命令
awk '条件1{动作1}条件2{动作2}...' 文件名
条件(Pattern)
- 一般使用关系表达式作为条件
- x>10判断变量x是否大于10
- x>=10大于等于
- x<=10小于等于
动作
- 格式化输出
- 流程控制语句
df -h | grep "/dev/sdb2" | awk '{print $5}' | cut -d '%' -f 1
BEGIN 开始之前
END 结束
FS内置变量
cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN {FS=":"} {printf $1 "\t" $3 "\n"}'
4、sed命令
sed主要是用来将数据进行选取、替换、删除、新增的命令
的
sed [选项] '[动作]' 文件名
选项
- n :一般sed命令会把所有数据都输出到屏幕,如果加入此选择则只会把经过sed命令处理的行输出到屏幕
- e : 允许对输入数据应用多条sed命令编辑
- i :用sed的修改结果直接修改读取数据的文件,而不是由屏幕输出
动作
- a :追加,在当前行后添加一行或多行
- c : 行替换,用c后面的字符传替换原数据行
- i : 插入,在当前行插入一行或多行
- d :删除,删除指定的行
- p :打印,输出指定的行
- s :字符替换,用一个字符串替换另外一个字符串。格式为"行范围s/旧字串/新字串/g"
字符串命令
1、排序命令sort
sort [选项] 文件名
- f : 忽略大小写
- n : 以数值型进行排序,默认使用字符串型排序
- r : 反向排序
- t : 指定分割符,默认是分割符是治标符
- k n[,m] : 按照指定的字段范围排序。从第n字段开始,m字段结束(默认到行尾)
2、统计命令
wc [选项] 文件名
- l : 只统计行
- w : 只统计单词数
- m : 只统计字符数