超大大文件替换与对比问题

工作中发现本地服务器和云服务生成的成果文件大小不同,两个文件都在11G以上,且有随机码,比较十分困难

为此需要做两件事情:

1.替换随机码

引文使用的是windows环境,自然想使用powershell去处理,但大文件替换,吃内存十分严重。卡死

Get-ChildItem C:\share\67 | ForEach-Object -Process{
if($_ -is [System.IO.FileInfo])
{
Write-Host($_.fullname);
$content = Get-Content -path $_.fullname
$newName=-join($_.fullname,'.new')
$content -Replace '\?\?\?0x[0-9A-F]*', '' |  Out-File  -Encoding utf8 $newName
}
}

后安装cygwin,使用linux的sed命令去处理。内存和CPU几乎不吃。

大文件查看命令 tail 和 head也非常实用。

 sed 's/???0x[0-9A-F]*//g' out_analyze_data_getCPAType.txt > del_228_result.txt
tail -n 100 /etc/cron  #显示最后100行数据
tail -n -100 /etc/cron #除了前99行不显示外,显示第100行到末尾行

2.比较两个大文件

本想使用LInux的diff命令,但内存依然耗尽。又想使用split命令按行切割,但考虑行数不一致,都否决了。必须两个大文件进行比较了 byond compare ,但运行时间超长12小时以上

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值