Linux sort uniq tr cut 及正则

最新推荐文章于 2021-10-26 15:02:57 发布

为你着迷@着迷

最新推荐文章于 2021-10-26 15:02:57 发布

阅读量116

点赞数 1

本文链接：https://blog.csdn.net/m0_53432902/article/details/114703244

版权

linux sort uniq tr cut 及正则

sort命令
以行为单位对文件内容进行排序，也可以根据不同的数据类型来排序

|1| sort   [选项]  参数 
|2| cat   file |  sort 选项

常用选项	功能
-f	忽略大小写，默认将大写字母排在后面
-b	忽略前导的空白区域
-n	按照数字进行排序
-r	反向排序
-u	等同于uniq，表示相同的数据仅显示一行
-t	指定字段分隔符，默认使用[Tab]键分隔
-k	指定排序字段
-o <输出文件>	将排序后的结果转存至指定文件

在这里插入图片描述

uniq命令
用于报告或者忽略文件中连续的重复行，常与 sort 命令结合使用

1|uniq [选项] 参数
2|cat file | uniq 选项

在这里插入图片描述

tr命令
常用来对来自标准输入的字符进行替换、压缩和删除

1|tr [选项] [参数]

在这里插入图片描述

删除Windows文件“造成”的’^M’字符

cat file | tr -s "\r" "\n" > new_file
或
cat file | tr -d "\r" > new_file
Linux中遇到换行符("\n")会进行回车+换行的操作，回车符反而只会作为控制字符("^M")显示，不发生回车的操作。
而windows中要回车符+换行符("\r\n")才会回车+换行，缺少一个控制符或者顺序不对都不能正确的另起一行。

在这里插入图片描述

正则表达式
通常用于判断语句中，用来检查某一字符串是否满足某一格式
正则表达式是由普通字符与元字符组成
普通字符包括大小写字母、数字、标点符号及一些其他符号
元字符是指在正则表达式中具有特殊意义的专用字符，可以用来规定其前导字符（即位于元字符前面的字符）在目标对象中的出现模式
基础正则表达式

支持的工具：grep、egrep、sed、awk

|1 | 基础正则表达式常见元字符 
|2 | \ ：转义字符，用于取消特殊符号的含义，例：\!、\n、\$等 
|3 |
|4 |^ ：匹配字符串开始的位置，例：^a、^the、^#、^[a-z]
|5 |  
|6 | $ ：匹配字符串结束的位置，例：word$、^$匹配空行 
|7 |
|8 |. ：匹配除\n之外的任意的一个字符，例：go.d、g..d  
|9 |  
|10|* ：匹配前面子表达式0次或者多次，例：goo*d、go.*d
|11|  
|12| [list] ：匹配list列表中的一个字符，例：go[ola]d，[abc]、[a-z]、[a-z0-9]、[0-9]匹配任意一位数字 
|13|
|14| [^list] ：匹配任意非list列表中的一个字符，例：[^0-9]、[^A-Z0-9]、[^a-z]匹配任意一位非小写字母 
|15|  
|16|\{n\} ：匹配前面的子表达式n次，例：go\{2\}d、'[0-9]\{2\}'匹配两位数字
|17|  
|18|  \{n,\} ：匹配前面的子表达式不少于n次，例：go\{2,\}d、'[0-9]\{2,\}'匹配两位及两位以上数字
|19|
|20| \{n,m\} ：匹配前面的子表达式n到m次，例：go\{2,3\}d、'[0-9]\{2,3\}'匹配两位到三位数字 
|21|  
|22|注：egrep、awk使用{n}、{n,}、{n,m}匹配时“{}”前不用加“\”

扩展正则表达式
支持的工具：egrep、awk
在这里插入图片描述
使用正则表达式
这里就举两个例子演示一下，主要的还是要看自己理解然后去使用
匹配182开头的手机号

在这里插入图片描述

为你着迷@着迷

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Linux sort uniq tr cut 及正则

**sort uniq tr cut 及正则**sort命令以行为单位对文件内容进行排序，也可以根据不同的数据类型来排序语法|1| sort [选项] 参数 |2| cat file | sort 选项常用选项功能-f忽略大小写，默认将大写字母排在后面-b忽略前导的空白区域-n按照数字进行排序-r反向排序-u等同于uniq，表示相同的数据仅显示一行-t指定字段分隔符，默认使用[Tab]键分隔-k指定排序字段
复制链接

扫一扫