grep 处理大文件太慢的方法

grep 处理大文件太慢的方法

1.更换编码方式

LC_ALL=C  fgrep -m 1 "content" filename

命令解释:

  1. 默认文本都采用UTF-8所以比较慢,因此编码方式换成C语言环境(ascii)
  2. grep 带有正则,fgrep则为纯文本匹配,因此会比grep更快
  3. -m 1 只匹配一次,匹配到就终止匹配(根据自己需求调整)

2.并发方式

cat filename | parallel --pipe fgrep -m 1 "con"

命令解释:

  1. 使用parallel来并发fgrep进程(不加 -j 指定并发数的话,默认每个核分配一个)

参考:

  1. https://stackoverflow.com/questions/13913014/grepping-a-huge-file-80gb-any-way-to-speed-it-up

  2. https://www.inmotionhosting.com/support/website/speed-up-grep-searches-with-lc-all/

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值