正则匹配与替换 regexp & regsub

最新推荐文章于 2024-06-01 09:30:00 发布

weixin_34087307

最新推荐文章于 2024-06-01 09:30:00 发布

阅读量2.9k

点赞数 2

文章标签： awk

原文链接：http://www.cnblogs.com/xiaoxie2014/p/9347620.html

版权

正则匹配是使用正则表达式匹配字符串的一种方法；在脚本编写过程中，经常需要处理一些文本，而这些文本中可能只有部分信息是有用的，我们需要从文本中提取出这些有用信息；这时候，就需要编写特定格式的正则表达式，将文本中符合正则表达式的字符串抓取出来，然后对其进行分解、组合、替换等处理，得到符合需求的处理结果。

正则表达式十分灵活，这也使其具有强大的匹配能力，熟练的编写正则表达式，几乎可以匹配任何形式的字符串。因此，在脚本设计中，熟练地使用正则表达式，是一种十分重要的技能，可以有效的提高脚本的运行效率。

使用正则表达式需要借助两个重要工具：regexp 和 regsub，分别用于匹配和替换。

（注：regexp & regsub 的操作对象是字符文本，如果需要直接对文件进行处理，可以使用 sed & awk ）

sed & awk 的用法参考这篇博文： sed & awk的用法

regexp

regexp 是用于判断正则表达式是否全部或者部分匹配目标字符串的命令，匹配返回 1，否则返回 0。

regexp 有两种用法，一种是仅匹配，另一种是匹配子串

第一种用法举例 regexp {^([0-9]+[a-z]+|[A-Z]+[0-9]+)$} 123abc，这个正则表达式用于匹配“数字开头且小写字母结尾” 或者 “大写字母开头且数字结尾” 的表达式，所以返回值为 1

详细解释： ^ 匹配开头，$ 匹配结尾，中间的 | 表示 “或”， + 表示前面的字符出现一次或者多次

第二种用法子串匹配举例 regexp {([0-9]+)\s([a-z]+)} "there are 100 apples" str01 sub01 sub02 ，这个正则表达式用于匹配“一个或多个数字加一个空格加一个或多个小写字母”，返回1

详细解释：表达式中包括两个子串 ([0-9]+) 和 ([a-z]+)，所以 str01="100 apples" 子串sub01=100 子串sub02=apples

regsub

regsub 是用于对目标字符串中满足正则表达式的部分进行替换，并将替换后的结果存入新的变量中，匹配成功返回 1，否则返回 0。

举例 regsub {there} “they live there lives” their x ，正则表达式为 there ，匹配字符串中的单词 there，将其替换为 their，并将替换后的字符串存入变量 x，返回 1，所以变量 x 的值就是 $x="they live their lives"

注意: regsub 有个选项 -all，如果没有这个开这个选项，则只替换第一个匹配，否则替换所有匹配到的目标

转载于:https://www.cnblogs.com/xiaoxie2014/p/9347620.html

weixin_34087307

关注

2
点赞
踩
32

收藏

觉得还不错? 一键收藏
0
评论
正则匹配与替换 regexp & regsub

正则匹配是使用正则表达式匹配字符串的一种方法；在脚本编写过程中，经常需要处理一些文本，而这些文本中可能只有部分信息是有用的，我们需要从文本中提取出这些有用信息；这时候，就需要编写特定格式的正则表达式，将文本中符合正则表达式的字符串抓取出来，然后对其进行分解、组合、替换等处理，得到符合需求的处理结果。正则表达式十分灵活，这也使其具有强大的匹配能力，熟练的编写正则表达式，几乎可以匹配任何形式的字符...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。