正则表达式与文本处理器

最新推荐文章于 2024-01-31 23:52:59 发布

秃头老头向前冲

最新推荐文章于 2024-01-31 23:52:59 发布

阅读量241

点赞数

文章标签：其他

本文链接：https://blog.csdn.net/weixin_44841019/article/details/124574550

版权

本文介绍了正则表达式的定义、元字符以及在Linux中的应用，包括基础正则表达式和扩展正则表达式。同时，详细讲解了几个常用的文件处理器：grep用于查找匹配的行，cut用于列截取，sort实现排序，uniq去除重复行，tr用于字符替换和删除。每个工具都给出了实例演示。

摘要由CSDN通过智能技术生成

一、正则表达式

①基础正则表达式（使用时需要加转义）

②扩展正则表达式（不需要转义）

1、正则表达式定义

●正则表达式，又称正规表达式、常规表达式

●正则表达式——通常用于判断语句中，用来检查某一字符串是否满足某一格式

●正则表达式组成

1）普通字符
大小写字母、数字、标点符号及一些其他符号

2）元字符
在正则表达式中具有特殊意义的专用字符

基础正则表达式常见元字符: (支持的工具: grep、 egrep、 sed、awk)

\      : 转义字符，用于取消特殊符号的含义，例: \!、\n、\$等

^      : 匹配字符串开始的位置，例: ^a、 ^the、 ^#、^[a-z]

$      : 匹配字符串结束的位置，例: word$、 ^$匹配空行

.      : 匹配除\n之外的任意的一个字符，例: go.d、g..d

*      : 匹配前面 子表达式0次或者多次，例: goo*d、go.*d

[list] : 匹配list列表中的一个字符，例: go[ola]d， [abc]、 [a-z]、 [a-z0-9]、 [0-9]匹配任意一位数字

[^list]: 匹配任意非list列表中的一个字符，例: [^0-9]、[^a-z]、[^A-Z0-9] 匹配任意一位非小写字母

\{
   n\}  : 匹配前面的子表达式n次，例: go\{
   2\}d、 '[0-9]\{2\}'匹配两位数字

\