正则表达式与文本处理器

本文介绍了正则表达式的定义、元字符以及在Linux中的应用,包括基础正则表达式和扩展正则表达式。同时,详细讲解了几个常用的文件处理器:grep用于查找匹配的行,cut用于列截取,sort实现排序,uniq去除重复行,tr用于字符替换和删除。每个工具都给出了实例演示。
摘要由CSDN通过智能技术生成

一、正则表达式

①基础正则表达式(使用时需要加转义)

②扩展正则表达式(不需要转义)

1、正则表达式定义

●正则表达式,又称正规表达式、常规表达式

●正则表达式——通常用于判断语句中,用来检查某一字符串是否满足某一格式

●正则表达式组成

1)普通字符
大小写字母、数字、标点符号及一些其他符号

2)元字符
在正则表达式中具有特殊意义的专用字符

基础正则表达式常见元字符: (支持的 工具: grep、 egrep、 sed、awk)

\      : 转义字符,用于取消特殊符号的含义,例: \!、\n、\$等

^      : 匹配字符串开始的位置,例: ^a、 ^the、 ^#、^[a-z]

$      : 匹配字符串结束的位置,例: word$、 ^$匹配空行

.      : 匹配除\n之外的任意的一个字符,例: go.d、g..d

*      : 匹配前面 子表达式0次或者多次,例: goo*d、go.*d

[list] : 匹配list列表中的一个字符,例: go[ola]d, [abc][a-z][a-z0-9][0-9]匹配任意一位数字

[^list]: 匹配任意非list列表中的一个字符,例: [^0-9][^a-z][^A-Z0-9] 匹配任意一位非小写字母

\{
   n\}  : 匹配前面的子表达式n次,例: go\{
   2\}d、 '[0-9]\{2\}'匹配两位数字

\
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值