Linux 大文件如何切割与合并?(2)

1. 文件切割 - split


在 Linux 系统下使用 split 命令进行大文件切割很方便。另外,Linux 系列面试题和答案全部整理好了,微信搜索Java技术栈,在后台发送:面试,可以在线阅读。

[1] 命令语法

# -a: 指定输出文件名的后缀长度(默认为2个:aa,ab…)

# -d: 指定输出文件名的后缀用数字代替

# -l: 行数分割模式(指定每多少行切成一个小文件;默认行数是1000行)

# -b: 二进制分割模式(支持单位:k/m)

# -C: 文件大小分割模式(切割时尽量维持每行的完整性)

split [-a] [-d] [-l <行数>] [-b <字节>] [-C <字节>] [要切割的文件] [输出文件名]

[2] 使用实例

# 行切割文件

$ split -l 300000 users.sql /data/users_

# 使用数字后缀

$ split -d -l 300000 users.sql /data/users_

# 按字节大小分割

$ split -d -b 100m users.sql /data/users_

[3] 帮助信息

# 帮助信息

$ split --help

Usage: split [OPTION]… [FILE [PREFIX]]

Output pieces of FILE to PREFIXaa, PREFIXab, …;

default size is 1000 lines, and default PREFIX is ‘x’.

With no FILE, or when FILE is -, read standard input.

Mandatory arguments to long options are mandatory for short options too.

-a, --suffix-length=N   generate suffixes of length N (default 2)            后缀名称的长度(默认为2)

–additional-suffix=SUFFIX  append an additional SUFFIX to file names

-b, --bytes=SIZE        put SIZE bytes per output file                       每个输出文件的字节大小

-C, --line-bytes=SIZE   put at most SIZE bytes of records per output file    每个输出文件的最大字节大小

-d                      use numeric suffixes starting at 0, not alphabetic   使用数字后缀代替字母后缀

–numeric-suffixes[=FROM]  same as -d, but allow setting the start value

-e, --elide-empty-files  do not generate empty output files with ‘-n’        不产生空的输出文件

–filter=COMMAND    write to shell COMMAND; file name is $FILE           写入到shell命令行

-l, --lines=NUMBER      put NUMBER lines/records per output file             设定每个输出文件的行数

-n, --number=CHUNKS     generate CHUNKS output files; see explanation below  产生chunks文件

-t, --separator=SEP     use SEP instead of newline as the record separator;  使用新字符分割

‘\0’ (zero) specifies the NUL character

-u, --unbuffered        immediately copy input to output with ‘-n r/…’     无需缓存

–verbose           print a diagnostic just before each                  显示分割进度

output file is opened

–help     display this help and exit                                    显示帮助信息

–version  output version information and exit                           显示版本信息

The SIZE argument is an integer and optional unit (example: 10K is 10*1024).

Units are K,M,G,T,P,E,Z,Y (powers of 1024) or KB,MB,… (powers of 1000).

CHUNKS may be:

N       split into N files based on size of input

K/N     output Kth of N to stdout

l/N     split into N files without splitting lines/records

l/K/N   output Kth of N to stdout without splitting lines/records

r/N     like ‘l’ but use round robin distribution

r/K/N   likewise but only output Kth of N to stdout

GNU coreutils online help: http://www.gnu.org/software/coreutils/

Full documentation at: http://www.gnu.org/software/coreutils/split

or available locally via: info ‘(coreutils) split invocation’


2. 文件合并 - cat


在 Linux 系统下使用 cat 命令进行多个小文件的合并也很方便

[1] 命令语法

# -n: 显示行号

# -e: 以$字符作为每行的结尾

# -t: 显示TAB字符(^I)

cat [-n] [-e] [-t] [输出文件名]

[2] 使用实例

# 合并文件

$ cat /data/users_* > users.sql

[3] 帮助信息

# 帮助信息

$ cat --h

Usage: cat [OPTION]… [FILE]…

Concatenate FILE(s) to standard output.

With no FILE, or when FILE is -, read standard input.

-A, --show-all           equivalent to -vET

-b, --number-nonblank    number nonempty output lines, overrides -n

-e                       equivalent to -vE

最后

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Java工程师,想要提升技能,往往是自己摸索成长,自己不成体系的自学效果低效漫长且无助。

因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,不论你是刚入门Java开发的新手,还是希望在技术上不断提升的资深开发者,这些资料都将为你打开新的学习之门!

如果你觉得这些内容对你有帮助,需要这份全套学习资料的朋友可以戳我获取!!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,不论你是刚入门Java开发的新手,还是希望在技术上不断提升的资深开发者,这些资料都将为你打开新的学习之门!**

如果你觉得这些内容对你有帮助,需要这份全套学习资料的朋友可以戳我获取!!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

  • 13
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值