grep 和正则表达式(适用于 sed 和 gawk )

当在大文件中查找一行数据时,使用grep帮助查找 grep [option] pattern [file]
或者借助管道筛选输出结果 ls | grep test

1. 正则表达式

1. posix基础正则表达式 (BRE) 引擎
  1. 点字符号 . 可以指代任意字符
  2. 锚字符 $ ^
  3. 字符组 [Yy] [a-z] [A-Z] [0-9]
  4. 排除型字符组 [^Yy]
  5. 星号 * 字符后面放置的星号表示该字符必须在匹配模式的文本中出现0次或多次
2. posix扩展正则表达式 (ERE) 引擎
  1. 问号 ? 字符后面放置的问号表示该字符必须在匹配模式的文本中出现0次或1次
  2. 加号 + 字符后面放置的加号表示该字符必须在匹配模式的文本中出现1次或多次
  3. 管道符号 | 如果任意一个模式匹配了数据流文本,文本就通过测试exp: [cat|dog]
  4. 花括号 {} 为可重复的正则表达式指定一个上限
    • {m} 正则表达式准确出现m次
    • {m, n} 正则表达式至少出现m次,至多出现n次
  5. 分组 ()

2. 我遇到的问题

Pattern Syntax
-E, --extended-regexp
Interpret PATTERNS as extended regular expressions
(EREs, see below).
或者使用egrep

  1. 当在使用 {} 时,匹配到了多次重复的值,并不是准确的重复n次
    文档中这样说到{n} The preceding item is matched exactly n times.
  2. 问题在于:tetete.txt 中 te重复了三次,但是这三次可以看作三个一次,所以te匹配了一次,其他俩个te各自匹配了一次,所以这个字符串符合{3}这个模式
  3. 如此说来,以下这中情形就好懂了:
    在这里插入图片描述
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值