【linux】使用sed删除大文件中的指定行

【linux】使用sed删除大文件中的指定行

引言: 最近在清洗数据时遇到一个超大的文件,需要删除其中不符合数据要求的指定行。使用之前写好的python脚本清洗速度太慢,于是检索了许多linux文件处理的命令,了解到sed这个命令工具。

sed命令的使用比较复杂,但是对于我的这个需求来说,使用其他还是比较简单的。最关键的,它支持正则表达式。

使用规则: sed '/正则表达式/d' 文件名 > 新文件名

比如删除vocab.txt文件中,字符串"while"开头的所有行:sed '/^while/d' vocab.txt > vocab_new.txt.

解释: "d"表示删除的意思,后面不接任何东西,正则表达式用两个“/”分隔开。最后一定要重定向到一个新的文件,因为sed命令是将删除后的结果在控制台上输出,如果不加重定向,则源文件中的内容是没有任何删除的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值