linux正则表达式之过滤空行和注释

linux过滤空行和注释

bash技术交流qq群:921383787

示例文本

cat > test.txt <<EOF
line1
  line2
  line3
#line4

#line5
EOF

过滤掉文本以#注释开头的行和空行

egrep -v '^#|^$' test.txt

过滤掉文本空行和空格开头的行

grep -P '\G\S' test.txt

过滤掉文本以空格开头的行

#方式1
grep -v "^\s" test.txt

#方式2
grep -v '^[[:blank:]]' test.txt

#方式3
grep -Ev "^[[:space:]]+" test.txt

#方式4
grep -v "^ " test.txt

#方式5
grep -P '^\S' test.txt

#方式6
grep -Pv '^\x20' test.txt

#方式7
grep -Pv '^[^\S]' test.txt

正则元字符汇总

正则表达式的分类:

  • 基本的正则表达式(Basic Regular Expression 又叫Basic RegEx 简称BREs)
  • 扩展的正则表达式(Extended Regular Expression 又叫Extended RegEx 简称EREs)
  • Perl的正则表达式(Perl Regular Expression 又叫Perl RegEx 简称PREs)

基本组成部分

正则表达式的基本组成部分。

正则表达式描述示例
\转义符,将特殊字符进行转义,忽略其特殊意义a.b匹配a.b,但不能匹配ajb,.被转义为特殊意义
^匹配行首,awk中,^则是匹配字符串的开始^tux匹配以tux开头的行
$匹配行尾,awk中,$则是匹配字符串的结尾tux$匹配以tux结尾的行
.匹配除换行符\n之外的任意单个字符,awk则中可以ab.匹配abc或bad,不可匹配abcd或abde,只能匹配单字符
[]匹配包含在[字符]之中的任意一个字符coo[kl]可以匹配cook或cool
[^]匹配[^字符]之外的任意一个字符123[^45]不可以匹配1234或1235,1236、1237都可以
[-]匹配[]中指定范围内的任意一个字符,要写成递增[0-9]可以匹配1、2或3等其中任意一个数字
?匹配之前的项1次或者0次colou?r可以匹配color或者colour,不能匹配colouur
+匹配之前的项1次或者多次sa-6+匹配sa-6、sa-666,不能匹配sa-
*匹配之前的项0次或者多次co*l匹配cl、col、cool、coool等
()匹配表达式,创建一个用于匹配的子串ma(tri)?匹配max或maxtrix
{n}匹配之前的项n次,n是可以为0的正整数[0-9]{3}匹配任意一个三位数,可以扩展为[0-9][0-9][0-9]
{n,}之前的项至少需要匹配n次[0-9]{2,}匹配任意一个两位数或更多位数
{n,m}指定之前的项至少匹配n次,最多匹配m次,n<=m[0-9]{2,5}匹配从两位数到五位数之间的任意一个数字
交替匹配

POSIX字符类

POSIX字符类是一个形如[:…:]的特殊元序列(meta sequence),他可以用于匹配特定的字符范围。

正则表达式描述示例
[:alnum:]匹配任意一个字母或数字字符[[:alnum:]]+
[:alpha:]匹配任意一个字母字符(包括大小写字母)[[:alpha:]]{4}
[:blank:]空格与制表符(横向和纵向)[[:blank:]]*
[:digit:]匹配任意一个数字字符[[:digit:]]?
[:lower:]匹配小写字母[[:lower:]]{5,}
[:upper:]匹配大写字母([[:upper:]]+)?
[:punct:]匹配标点符号[[:punct:]]
[:space:]匹配一个包括换行符、回车等在内的所有空白符[[:space:]]+
[:graph:]匹配任何一个可以看得见的且可以打印的字符[[:graph:]]
[:xdigit:]任何一个十六进制数(即:0-9,a-f,A-F)[[:xdigit:]]+
[:cntrl:]任何一个控制字符(ASCII字符集中的前32个字符)[[:cntrl:]]
[:print:]任何一个可以打印的字符[[:print:]]

元字符

元字符(meta character)是一种Perl风格的正则表达式,只有一部分文本处理工具支持它,并不是所有的文本处理工具都支持。

正则表达式描述示例
\b单词边界\bcool\b 匹配cool,不匹配coolant
\B非单词边界cool\B 匹配coolant,不匹配cool
\d单个数字字符b\db 匹配b2b,不匹配bcb
\D单个非数字字符b\Db 匹配bcb,不匹配b2b
\w单个单词字符(字母、数字与_)\w 匹配1或a,不匹配&
\W单个非单词字符\W 匹配&,不匹配1或a
\n换行符\n 匹配一个新行
\s单个空白字符x\sx 匹配x x,不匹配xx
\S单个非空白字符x\S\x 匹配xkx,不匹配xx
\r回车\r 匹配回车
\t横向制表符\t 匹配一个横向制表符
\v垂直制表符\v 匹配一个垂直制表符
\f换页符\f 匹配一个换页符

参考:https://man.linuxde.net/docs/shell_regex.html

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Linux正则表达式是一种用来匹配文本内容的表达式,它可以方便地在Linux系统中进行文本处理和搜索。下面是一份Linux正则表达式大全,包括常用的正则表达式语法和示例: 1. 字符匹配 正则表达式语法:字符 示例: * 匹配单个字符: ``` a 匹配'a'字符 ``` * 匹配多个字符: ``` [abc] 匹配'a'、'b'或'c'字符 [^abc] 匹配除'a'、'b'、'c'以外的任意字符 [a-z] 匹配小写字母a到z中的任意一个字符 [A-Z] 匹配大写字母A到Z中的任意一个字符 [0-9] 匹配数字0到9中的任意一个字符 ``` 2. 重复匹配 正则表达式语法:字符+、字符*、字符? 示例: * 匹配多个字符: ``` a+ 匹配一个或多个'a'字符 a* 匹配零个或多个'a'字符 a? 匹配零个或一个'a'字符 ``` 3. 边界匹配 正则表达式语法:^、$ 示例: * 匹配行首和行尾: ``` ^a 匹配以'a'字符开头的行 a$ 匹配以'a'字符结尾的行 ``` 4. 逻辑匹配 正则表达式语法:字符1|字符2 示例: * 匹配两种字符中的任意一种: ``` a|b 匹配'a'或'b'字符 ``` 5. 分组匹配 正则表达式语法:(字符) 示例: * 匹配分组中的字符: ``` (a) 匹配'a'字符 ``` 6. 转义字符 正则表达式语法:\字符 示例: * 匹配特殊字符: ``` \. 匹配'.'字符 \* 匹配'*'字符 \+ 匹配'+'字符 \? 匹配'?'字符 \( 匹配'('字符 \) 匹配')'字符 ``` 以上是Linux正则表达式的常用语法和示例,可以根据实际需求进行学习和使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值