Linux 删除文本中的重复行

最新推荐文章于 2023-06-24 19:06:27 发布

阳光岛主

最新推荐文章于 2023-06-24 19:06:27 发布

阅读量1.9w

点赞数

分类专栏： Linux/Shell 文章标签： linux shell file 算法测试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ithomer/article/details/8035541

版权

Linux/Shell 专栏收录该内容

169 篇文章 10 订阅

订阅专栏

在进行文本处理的时候，我们经常遇到要删除重复行的情况。那怎么解决呢？

下面就是三种常见方法？

第一，用sort+uniq，注意，单纯uniq是不行的。

shell> sort -k2n file | uniq

这里我做了个简单的测试，当file中的重复行不再一起的时候，uniq将服务删除所有的重复行。经过排序后，所有相同的行都在相邻，因此unqi可以正常删除重复行。

第二，用sort+awk命令，注意，单纯awk同样不行，原因同上。

shell> sort -k2n file | awk '{if ($0!=line) print;line=$0}'

当然，自己把管道后面的代码重新设计一下，可能不需要sort命令先排序拉。

第三，用sort+sed命令，同样需要sort命令先排序。

shell> sort -k2n file | sed '$!N; /^\(.*\)\n\1$/!P; D'

最后附一个必须先用sort排序的文本的例子，当然，这个需要用sort排序的原因是很简单，就是后面算法设计的时候的“局部性”，相同的行可能分散出现在不同的区域，一旦有新的相同行出现，那么前面的已经出现的记录就被覆盖了，看了这个例子就好理解拉。
　　

ffffffffffffffffff
ffffffffffffffffff
eeeeeeeeeeeeeeeeeeee
fffffffffffffffffff
eeeeeeeeeeeeeeeeeeee
eeeeeeeeeeeeeeeeeeee
gggggggggggggggggggg

其实，这是我随便打进去的几行字，没想到就是必须用sort的很好例子，大家可以自己试试看。

参考推荐：

删除文本中的重复行(sort+uniq/awk/sed)

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
Linux 删除文本中的重复行

在进行文本处理的时候，我们经常遇到要删除重复行的情况。那怎么解决呢？下面就是三种常见方法？第一，用sort+uniq，注意，单纯uniq是不行的。shell> sort -k2n file | uniq这里我做了个简单的测试，当file中的重复行不再一起的时候，uniq将服务删除所有的重复行。经过排序后，所有相同的行都在相邻，因此unqi可以正常删除重复行。第二，用sort+awk命令，注意，单纯
复制链接

扫一扫

专栏目录

阳光岛主

CSDN认证博客专家 CSDN认证企业博客

码龄15年

743: 原创

7445: 周排名

93万+: 总排名

1668万+: 访问

: 等级

10万+: 积分

1万+: 粉丝

3676: 获赞

3049: 评论

4808: 收藏

私信

关注

热门文章

分类专栏

Python 学习入门 51篇
Algorithm 87篇
设计模式 2篇
Android开发的点点滴滴 32篇
Clojure 学习总结 18篇
C/C++/C# 114篇
Linux/Shell 169篇
QT 13篇
Script 160篇
NetWork 55篇
SQL Index 63篇
SoftWare 34篇
Java/JSP 47篇
Learn 63篇
IT Trend 60篇
Android 96篇
Cloud 10篇
iOS 4篇

最新评论

Python + Selenium + Chrome 使用代理 auth 的用户名密码授权
cqutlqxjy: 然后报错: hp, ht, pid, tid = _winapi.CreateProcess(executable, args, FileNotFoundError: [WinError 2] 系统找不到指定的文件。这个报错我分析了下，有可能是跟windows或者linux有关。现在还没找到这个错误的解决方案
Python + Selenium + Chrome 使用代理 auth 的用户名密码授权
cqutlqxjy: 两个版本的方案是对于windows还是linux?我第一个方案(Selenium + chromedriver 代理使用，无密码或已设置白名单ip 这个标题) ，在windows vscode运行，发现在 display = Display(visible=0, size=(800, 600)) 这一行报错: hp, ht, pid, tid = _winapi.CreateProcess(executable, args, FileNotFoundError: [WinError 2] 系统找不到指定的文件。
Python 发送 email 的三种方式
暴走水煮鱼: 老师，图片挂掉了，重新传一下呗
CentOS 配置swap交换区的方法
walkuere: 有没有办法不重启加虚拟内存？
全球云服务商对比：阿里云，太贵了
Linode_agent: 可以考虑考虑我们家linode

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。