linux汇总整理-正则篇

最新推荐文章于 2024-09-12 20:58:18 发布

hilinghuchong

最新推荐文章于 2024-09-12 20:58:18 发布

阅读量402

点赞数 3

分类专栏： Linux 文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/hilinghuchong/article/details/141329479

版权

Linux 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

正则表达式通配符

.:匹配任意的一个字符。
?:匹配前面的子表达式，最多一次。
*:匹配前面的子表达式零次或多次。
+:匹配前面的子表达式一次或多次。
{N}:匹配前面的子表达式 N 次。
{N,}:匹配前面的子表达式 N 次到多次。
{N,M}：匹配前面的子表达式 N 到 M 次，至少 N 次至多 M 次。
-:只要不是在序列开始、结尾或者序列的结束点上，表示序列范围。
^:匹配一行开始的空字符串；也表示字符不在要匹配的列表中。
$:匹配一行末尾的空字符串。
\b:匹配一个单词前后的空字符串。
\B:匹配一个单词中间的空字符串。
\<:匹配单词前面的空字符串。
\>:匹配单词后面的空字符串。
[:alnum:]:字母数字字符
[:alpha:]:字母字符
[:blank:]:空字符: 空格键符和制表符
[:digit:]:数字: ‘0 1 2 3 4 5 6 7 8 9’
[:lower:]:小写字母: ‘a b c d e f g h i j k l m n o p q r s t u v w x y z’
[:space:]:空格字符: 制表符、换行符、垂直制表符、换页符、回车符和空格键符
[:upper:]:大写字母: ‘A B C D E F G H I J K L M N O P Q R S T U V W X Y Z’

使用示例

匹配所有大写字母：grep '[:upper:]' 文件名
检测磁盘使用率：awk '{if(substr($4,length($4),length($4))=="%"){print $4} else {print $1}}' ni

去掉某html文件中的tags

源html文件如下

<b>This</b> is what <span style="text-decoration: underline;">I</span> meant. Understand?

使用sed命令处理

# 如果你这样搞的话，就会有问题
$ sed 's/<.*>//g' html.txt
Understand? 
# 要解决上面的那个问题，就得像下面这样。
# 其中的'[^>]' 指定了除了>的字符重复0次或多次。
$ sed 's/<[^>]*>//g' html.txt
This is what I meant. Understand?

合并行操作

待处理文本如下：

      T 119.163.122.65:37018 -> 119.163.193.242:80 [AP]
      x-forwarded-for: 10.87.15.180
      T 119.163.193.242:80 -> 119.163.122.65:37018 [AP]
      T 119.163.122.65:36792 -> 119.163.193.242:80 [AP]
      x-forwarded-for: 10.86.180.87
      T 119.163.193.242:80 -> 119.163.122.65:36792 [AP]
      T 119.163.122.65:44387 -> 119.163.193.242:80 [AP]
      x-forwarded-for: 10.86.146.16

希望处理成如下格式：

      T 119.163.122.65:37018 -> 119.163.193.242:80 [AP]    x-forwarded-for: 10.87.15.180
      T 119.163.193.242:80 -> 119.163.122.65:37018 [AP]
      T 119.163.122.65:36792 -> 119.163.193.242:80 [AP]    x-forwarded-for: 10.86.180.87
      T 119.163.193.242:80 -> 119.163.122.65:36792 [AP]
      T 119.163.122.65:44387 -> 119.163.193.242:80 [AP]    x-forwarded-for: 10.86.146.16

脚本1：sed ':l N; s/\nx-forward/ x-forward/; $!tl' test.txt
脚本2：sed ':l N; s/\nx-forward/ x-forward/; bl' test.txt
脚本3：sed ':a;N;/\nx-forward/!ba;s/\nx-forward/ x/' test.txt
脚本4：awk '/->/{$0="\n"$0}{printf $0}' test.txt