Perl-用正则表达式处理文本4

本文详细介绍了Perl中的正则表达式在处理多行文本时的应用,包括使用m//修饰符实现跨行模式匹配,以及如何利用^和$匹配行首行尾。此外,还展示了如何直接修改文件内容,特别是使用钻石操作符<>进行逐行读取和替换,并通过-i选项创建备份。最后,讲解了如何通过命令行直接更新文件内容,使用perl的一次性替换功能。
摘要由CSDN通过智能技术生成

1. 跨行模式匹配

传统的正则表达式是用来匹配单行文本的,不过perl可以处理任意长度的字符串,处理多行文本和处理单行文本没啥实质性的差别

$_ = "I'm much better\nthan Barney is\nat bowling, \nWilma.\n";

^$用于匹配整个字符串的开始和结束的锚位
当模式加上m//修饰符后,可以用^$来匹配字符串内的每一行(m:multiple lines),现在,它们代表的位置是每行的开头和结尾

print "Found 'wilma' at start of line" if /^wilma\b/im; # 匹配成功

可以对多行文本逐个进行替换

open FILE, $filename or die "Can't open '$filename': $!";
my $lines = join '', <FILE>;
$lines =~ s/^/$filename: /gm;

2. 一次更新多个文件

通过程序自动更新文件内容时,常见的做法是先打开一个和原来一样的新文件,然后在需要的位置进行修改,最后用修改后的文件替换原来的文件。
要在perl中直接修改文件内容可以使用钻石操作符<>

#!/usr/bin/perl -w

use strict;

chomp(my $date = `date`);
$^I = ".bak";

while(<>){
	s/\AAuthor:.*/Author: Randal L. Schwartz/;
	s/\APhone:.*\n//;
	s/\ADate:.*/Date: $date/;
	print;
}

钻石操作符会读取命令参数指定的那些文件。程序的主循环一次会读取、更新及输出1行。更新过的内容如何写回文件?$^I变量的默认值是undef,表示什么都不会发生。如果$^I中是个字符串,该字符串就会变成备份文件的扩展名。

假设钻石操作符正好打开了fred03.bat文件,除了像以前一样打开文件外,它还会把文件名改成fred03.bat.bak,接着,钻石操作符会打开一个新文件并将它命名为fred03.bat。现在钻石操作符会把默认的输出设定为这个新打开的文件(fred03.bat),所以输出来的所有内容都会被写进这个文件。这样,wilhe循环会从旧文件读进1行输入,做一些改动,然后把新的内容写进新文件。在普通的机器上,这样的程序可以在几秒内更新上百个文件。
钻石操作符也会尽可能赋值原文件的所有者权限以及所有者设定

有人会把$^I的值设为~这个字符,因为emacs在处理备份文件的文件名时也是这么做的。如果把$^I设成空字符串,就会直接修改文件的内容,但不会留下任何备份。

3. 从命令行直接替代文件内容

$ perl -p -i.bak -w -e 's/Randall/Randal/g' fred*.bat
-p选项类似以下代码

while(<>){
	print;
}

-n选项类似以下代码

while(<>){
}

-i.bak在程序开始运行前将$^I设为“.bak”,如果不想要备份,可以直接写-i,不加扩展名
-w选项开启警告功能
-e告诉perl后面跟着的是可供执行的程序源代码,s/Randall/Randal/g这个字符串会被直接当成perl程序代码
fred*.dat表示@ARGV的值应该是匹配此文件模式的所有文件名

#!/usr/bin/perl -w

$^I = ".bak";

while(<>){
	s/Randall/Randal/g;
	print;
}
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值