perl统计文本单词数量

在做文本处理时,我们经常需要统计文本单词数量,给大家分享一段代码。

open IN,'test.txt';
while(<IN>){
        chomp;   #出去换行符\n
 $line = $_;
 $line =~ s /[ . , ? ! ; : ' " ( ) { }  \[ \]] / /g; #句号,逗号等统一改为空格
        @words = split(/ /,$line);
        foreach $word (@words){
                ++$counts{lc($word)                        
                };
        }
};  #将出现的单词存入hash表
foreach $word (keys %counts) {
        print "$word,$counts{$word}\n";
        }#打印出单词出现的个数


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值