5、Linux:如何将大文件切割成多份小文件

最近,在做数据文件的导入操作时,发现有些文本文件太大了,需要将这样的大文件切分成多个小文件进行操作。那么,Linux 中如何将大文件切割成许多的小文件呢?在此记录一下。

Linux 提供了 split 命令可以轻松实现大文件的分割,其命令格式如下:

split [操作大文件的参数] [大文件] [输出文件的可选参数] [输出文件名]

其中,操作大文件的参数,有多种切分模式:

  • -<行数> 或 -l <行数> :按行数切割,比如 -100,表示每 100 行切分成一个小文件。
  • -b <行数> 或 -C <行数> :按字节数切割,比如 50M,表示每 50M 切分成一个小文件。-b 与 -C 的区别是,-C 按字节切割的同时会尽量保证每行的完整性。

输出文件的可选参数,控制输出文件形式:

  • -d:使用数字作为后缀;
  • -a <n>:如果以数字作为后缀时,则指定n位数;
  • 不加任何参数及输出文件名的话,则输出文件则默认用 xaa,xab,....,xaz 等作为输出文件名,x 是文件的前导名,aa...az 是文件的后导名。

举例说明:

1、每3万行切割成一个小文件

[xxxxxxxxxx@localhost ~]$ split -l 30000 big_temp.log
[xxxxxxxxxx@localhost ~]$ ls
big_temp.log  xaa xab xac xad xae xaf xag xah

2、按3万切割,输出文件的导名加上3位数字

[xxxxxxxxxx@localhost ~]$ split -l 30000 big_temp.log -d -a 3 big_temp
[xxxxxxxxxx@localhost ~]$ ls
big_temp.log  big_temp000 big_temp001 big_temp002 big_temp003
big_temp004 big_temp005 big_temp006 big_temp007

3、每 50M 切割成一个小文件

[xxxxxxxxxx@localhost ~]$ split -b 50m big_temp.log
[xxxxxxxxxx@localhost ~]$ ls
big_temp.log  xaa xab xac xad

4、按 50M 切割,输出文件的后导名为系统默认

[xxxxxxxxxx@localhost ~]$ split -b 50m big_temp.log big_temp
[xxxxxxxxxx@localhost ~]$ ls
big_temp.log  big_tempaa big_tempab big_tempac big_tempad

实操如下:

有一个数据量约 72G 的文本文件,现在按照 500w 行切割成小文件,效果如下:

 最后

不知道有没有注意到,大文件分割成许多的小文件之后,小文件是没有后缀的,也就是小文件没有文件类型,这显然是需要加后缀的。那么,该如何批量对这些文件进行添加后缀名呢?

Linux 中的 mv 命令可以实现对单个文件加后缀名,然后结合 for 循环则可以轻易实现批量操作了,如下:

for i in `ll *_temp*`; do mv -f $i $i.txt;done

加上 txt 后缀,效果如下:

 至此,就实现了将大文件切割成多份小文件,且保持与大文件相同后缀的目标了。

  • 12
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要按大小切割日志文件,可以使用 logrotate 工具来实现。logrotate 工具可以定期对指定的日志文件进行轮转,以便于管理和备份。 以下是按大小切割日志文件的步骤: 1. 安装 logrotate 工具,可以使用以下命令进行安装: ``` sudo apt-get install logrotate ``` 2. 创建一个 logrotate 配置文件,可以在 /etc/logrotate.d 目录下创建一个新的文件,例如 /etc/logrotate.d/myapp。在该文件中,可以配置需要轮转的日志文件、轮转周期、保存的备份数量等参数。例如: ``` /var/log/myapp.log { size 10M rotate 5 compress dateext create 0644 root root } ``` 上面的配置表示,对 /var/log/myapp.log 文件进行轮转,当文件大小达到 10M 时进行轮转,最多保存 5 个备份文件,使用 gzip 进行压缩,备份文件名添加日期后缀,新建备份文件的权限为 0644,属主为 root。 3. 手动执行 logrotate 来进行日志轮转,可以使用以下命令来进行手动轮转: ``` logrotate -f /etc/logrotate.d/myapp ``` 上面的命令表示,强制执行 /etc/logrotate.d/myapp 配置文件中定义的轮转操作。 4. 配置 logrotate 定时任务,定期执行轮转操作。可以编辑 /etc/crontab 文件,添加以下行: ``` 0 0 * * * root logrotate -f /etc/logrotate.d/myapp ``` 上面的配置表示,每天午夜 0 点执行 logrotate 命令来进行日志轮转。 注意:在配置 logrotate 时,需要根据实际情况进行配置,以免误删重要的日志信息。另外,需要按照一定的规则来命名备份文件,以便于管理和查找。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值