perl删除文本中所有重复的行

我们看后仿波形,分析后仿时序为例时,对着茫茫多的log,实在没有精力一行一行的过,最好的办法是用脚本,将时序为例都写到新的文件中,然后我们再将文档中重复的时序为例都去掉,剩下的才是我们真正需要关注的Timing violation,至于为啥要删除重复的,是因为,一般出现时序违例的地方,常常会一直报x态到log里,我们只需要保留最开始的那一个即可。

好了,以上都是我们需要解决的问题的前提,这块我只记录如何使用perl删掉文档中所有重复的行,代码如下:


for($i = 0 ; $i < $line_temp_cnt ; $i++ )
{
    open VIO_T , "<$vio_temp_file" or die "Cant open violation_temp.log!";

    if($simulator eq "vcs")
    {
        while(my $line = <VIO_T>)
        {
            chomp($line);
            if($linecnt < $i+1)
            {
                if(($line =~ m/violation in(\s+\S+)/) and ($i == $linecnt))
                {
                    $patten = $1;
                }
                $linecnt ++;
            }
            elsif($line =~ m/$patten/)
            {
                push(@redundant,$linecnt);
                $vio_cut_hash{$linecnt} = 1;        
                $linecnt++;
            }
            else
            {
                $linecnt++;
            }
        }
    
        $linecnt = 0;
        $patten  = '';
        close(VIO_T);
    }
    print "$i One loop done!\n";
}

整个过程一共分三个步骤:

1,从第一行开始提取特征,即 violation后的字符串;

2,遇见相同的patten(这块从提取的特征哪里可以得到)记录到数组里面;

3,本轮循环结束,下一次从第二行开始提取特征,总的循环次数是整个时序违例文档的行数;

如上我们得到的@redundant数据就是所有的重复行的编号,下面我们只需要删掉这个数组里面保存的行号对应的行即可,至于如何删除,其实很简单啦,这里不是讨论的重点。

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
可以使用 Perl 的文件操作函数来实现将大文本文件按照指定数分割成小文本文件的功能。 以下是一个示例代码,可以将大文本文件 `input.txt` 按照每个文件 5000 的大小拆分成若干个小文本文件,并以 `output_1.txt`、 `output_2.txt`、 `output_3.txt` ... 的方式命名保存。 ```perl #!/usr/bin/perl use strict; use warnings; # 每个输出文件的数 my $lines_per_file = 5000; # 输入文件名 my $input_file = "input.txt"; # 输出文件名前缀 my $output_file_prefix = "output_"; # 初始化计数器和输出文件名 my $line_count = 0; my $file_count = 1; my $output_file = "$output_file_prefix$file_count.txt"; # 打开输入和输出文件 open(INPUT, "<", $input_file) or die "Cannot open $input_file for reading: $!"; open(OUTPUT, ">", $output_file) or die "Cannot open $output_file for writing: $!"; # 逐读取输入文件并写入输出文件 while (my $line = <INPUT>) { # 计数器加1 $line_count++; # 如果计数器达到了指定数,关闭当前输出文件并打开新的输出文件 if ($line_count > $lines_per_file) { close(OUTPUT); $file_count++; $output_file = "$output_file_prefix$file_count.txt"; open(OUTPUT, ">", $output_file) or die "Cannot open $output_file for writing: $!"; $line_count = 0; } # 将当前写入输出文件 print OUTPUT $line; } # 关闭输入和输出文件 close(INPUT); close(OUTPUT); ``` 这个代码,我们首先指定每个输出文件的数 `$lines_per_file` 和输入文件名 `$input_file`,然后初始化计数器和输出文件名,打开输入和输出文件。接着,我们逐读取输入文件,并将当前写入输出文件。每当计数器达到了指定数时,关闭当前输出文件并打开新的输出文件,重置计数器和输出文件名。 你可以根据实际需求修改代码的参数,比如输出文件名前缀、每个输出文件的数等等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值