perl删除文件中的重复行

最新推荐文章于 2021-12-02 14:37:14 发布

xiaocao9903

最新推荐文章于 2021-12-02 14:37:14 发布

阅读量3.8k

点赞数 1

分类专栏： perl修改文件的方法文章标签： Perl Linux

perl修改文件的方法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

perl删除文件中的重复行 2011-09-28 19:59:57

分类： Python/Ruby

如果有一个文件data有10G大，但是有好多行都是重复的，需要将该文件中重复的行合并为一行，那么我们需要用什么办法来实现
cat data |sort|uniq > new_data #该方法可以实现，但是你需要花上好几个小时。结果才能出来。
下面是一个使用perl脚本来完成此功能的小工具。原理很简单，创建一个hash，每行的内容为键,值由每行出现的次数来填充，脚本如下;