【shell脚本正则表达式】

最新推荐文章于 2024-07-17 21:15:10 发布

墨庾

最新推荐文章于 2024-07-17 21:15:10 发布

阅读量415

点赞数

文章标签：正则表达式 linux 运维

本文链接：https://blog.csdn.net/zhangyuanzhangy/article/details/125277466

版权

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

一、管道命令
- 1.sort
- 2.uniq
- 3.tr
- 4.cut
二、正则表达式

一、管道命令

1.sort

是一个以行为单位对文件内容进行排序的工具，也可以根据不同的数据类型来排序。例如数据和字符的排序就不一样
语法：
sort [选项] 参数

常用选项
-t：指定分隔符，默认使用[Tab]吧键或空格分隔
-k：指定排序区域，哪个区间排序
-n：按照数字进行排序，默认是以文字形式排序
-u：等同于 uniq，表示相同的数据仅显示一行，注意：如果行尾有空格去重就不成功
-r：反向排序，默认是升序，-r就是降序
-o：将排序后的结果转存至指定文件

2.uniq

主要用于去除连续的重复行
注意：是连续的行，所以通常和sort结合使用先排序使之变成连续的行再执行去重操作，否则不连续的重复行他不能去重

（1）语法
uniq [选项] 参数

（2）常用选项
-c：对重复的行进行计数；
-d：仅显示重复行；
-u：仅显示出现一次的行

3.tr

它可以用一个字符来替换另一个字符，或者可以完全除去一些字符，也可以用它来除去重复字符

语法
用法：tr [选项]… SET1 [SET2]
从标准输入中替换、缩减和/或删除字符，并将结果写到标准输出。

常用选项
-d 删除字符
-s 删除所有重复出现的字符，只保留第一个

4.cut

显示行中的指定部分，删除文件中指定字段
-f 通过指定哪一个字段进行提取。cut命令使用“TAB”作为默认的字段分割符
-d “TAB”是默认的分隔符，使用此选项可更改为其他的分隔符

-complement 用于排除所指定的字段
-output-delimiter 更改输出内容的分隔符

二、正则表达式

1.正则表达式的定义

正则表达式—通常用于判断语句中，用来检查某一字符串是否满足某一格式
正则表达式是由普通字符与元字符组成
普通字符包括大小写字母、数字、标点符号及一些其他符号
元字符是指在正则表达式中具有特殊意义的专用字符，可以用来规定其前导字符（即位于元字符前面的字符）在目标对象中的出现模式

正则表达式组成
普通字符包括大小写字母、数字、标点符号及一些其他符号。
元字符是指在正则表达式中具有特殊意义的专用字符

LINUX 中常用的有两种正则表达式引擎
基础正则表达式：BRE
扩展正则表达式: ERE

2.常见元字符（支持的工具：find、grep、egrep、sed和awk）

. 表示任意一个字符
[ ] 匹配括号中的一个字符
^ 表示否定括号中出现字符类中的字符,取反
\转义字符用于取消特殊符号的含义
^ 匹配字符串开始的位置
$ 匹配字符串结束的位置
{n} 匹配前面的子表达式n次
{n,} 匹配前面的子表达式不少于n次
{n,m} 匹配前面的子表达式n到m次
[:alnum:] 匹配任意字母和数字
[:alpha:] 匹配任意字母，大写或小写
[:lower:] 小写字符a-z
[:upper:] 大写字符A-Z
[:blank:] 空格和TAB字符
[:space:] 所有空白字符( 新行、空格、制表符)
[:digit:] 数字 0-9
[:xdigit:] 16 进制数字
[:cntrl:] 控制字符

表示任意一个字符

#表示任意一个字符
[root@yxp data]#echo abc|grep "a.c"
abc
#原来的点需要加\转义
[root@yxp data]#echo abc|grep "a\.c"
 
#标准格式需要加'' 或者""
[root@yxp data]#echo abc a.c|grep "a\.c"
abc a.c
 
[root@yxp data]#echo abc adc|grep "a.c"
abc adc

[ ] 匹配括号中的一个字符

#[yxp]
[root@yxp opt]#ls |grep "[yxp].txt"
p.txt
x.txt
y.txt
yxp.txt
 
 
#[0-9]
[root@yxp opt]#ls |grep "[0-9].txt"
0.txt
1.txt
2.txt
3.txt
4.txt
5.txt
6.txt
7.txt
8.txt
9.txt
 
#{
   a..d}
[root@yxp aa]#touch {
   a..z}.txt
[root@yxp aa]#ls
a.txt  e.txt  i.txt  m.txt  q.txt  u

最低0.47元/天解锁文章

墨庾

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【shell脚本正则表达式】

是一个以行为单位对文件内容进行排序的工具，也可以根据不同的数据类型来排序。例如数据和字符的排序就不一样语法：sort [选项] 参数常用选项-t：指定分隔符，默认使用[Tab]吧键或空格分隔-k：指定排序区域，哪个区间排序-n：按照数字进行排序，默认是以文字形式排序-u：等同于 uniq，表示相同的数据仅显示一行，注意：如果行尾有空格去重就不成功-r：反向排序，默认是升序，-r就是降序-o：将排序后的结果转存至指定文件主要用于去除连续的重复行注意：是连续的行，所以通常和sort结合使用先
复制链接

扫一扫