正则表达式与sed脚本使用指南
1. 正则表达式基础
正则表达式在文本处理中有着广泛的应用,下面我们先来看一些具体的例子以及相关的sed命令运用。
有这样一个正则表达式,它使用sed中的花括号来匹配 “一个数字,后面至少跟着五个点,再跟着一个数字”。为了展示其实际效果,我们给出一个sed命令,该命令将前面的点替换为连字符:
$ sed ’s/\([0-9][0-9]*\)\.\{5,\}\([0-9][0-9]*\)/\1-\2/’ sample
假设 sample 文件内容如下:
1.....5
5.....10
10.....20
100.....200
执行上述sed命令后,输出结果为:
1-5
5-10
10-20
100-200
类似地,我们还可以编写正则表达式来匹配一个或多个前导制表符,或者数据列之间的制表符。你可以更改列的顺序,也可以用其他分隔符替换制表符。建议你使用sed或grep进行简单和复杂的替换实验,以加深理解。
以下是一些有用的正则表达式示例表格:
| 项目 | 正则表达式 |
| ---- | ---- |
| 州的邮政缩写 | [A-Z][A-Z] |
| 城市,州 | ˆ.*, [A-Z][A-Z] |
| 城市,州,邮编 (POSIX egrep) | <
超级会员免费看
订阅专栏 解锁全文
7

被折叠的 条评论
为什么被折叠?



