将文件内容逐行读取处理并写入对应文件中

最新推荐文章于 2024-03-07 20:00:51 发布

长江之友

最新推荐文章于 2024-03-07 20:00:51 发布

阅读量5.3k

点赞数 5

分类专栏： Linux 文章标签： awk shell sed 大数据文件 Linux

本文链接：https://blog.csdn.net/changjiangbuxi/article/details/49686861

版权

针对3.6G、4000万行的大数据文件，通过awk逐行读取，依据倒数第二个域（日期）分类，生成以处理后日期命名的文件。初始的for循环+awk+sed方法效率低下，而改进的awk单命令解决方案显著提升了处理速度，能在一小时内完成。后续使用额外命令对文件进行批量重命名。

摘要由CSDN通过智能技术生成

场景：现有一个文件里面有大量的数据，约3.6G，4000多万行，每行的数据格式是一样的，共有9个域，如下：

3880961244329353 9 26 3862561814 2015-08-28 23:45:28 qinglei 2015-08-28 23:50:13

现在的需求是：将每一行数据按照倒数第二个域的日期来分类，相同日期的行写入相应日期的文件中，并且对文件名的日期进行处理（将”2015-08-28”修改为20150828,并以此命名文件名）

解决办法一：
刚开始没有考虑到效率的问题，只是想实现它，所以写了比较笨的方法，如下：

history_line_all_count=`cat /data0/userreport/activeprocess/activeprocess.history.log | wc -l`
echo $history_line_all_count
for((i=1;i<=$history_line_all_count;i++));
do
    date=`awk

最低0.47元/天解锁文章

长江之友

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
将文件内容逐行读取处理并写入对应文件中

场景：现有一个文件里面有大量的数据，约3.6G，4000多万行，每行的数据格式是一样的，共有9个域，如下： 3880961244329353 9 26 3862561814 2015-08-28 23:45:28 qinglei 2015-08-28 23:50:13现在的需求是：将每一行数据按照倒数第二个域的日期来分类，相同日期的行写入相应日期的文件中，并且对文件名的日期进行处理（
复制链接

扫一扫

专栏目录