【busybox记录】【shell指令】csplit

最新推荐文章于 2024-09-14 08:30:00 发布

梦幻面条EW

最新推荐文章于 2024-09-14 08:30:00 发布

阅读量946

点赞数 10

分类专栏： busybox工具和linux指令学习文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/weixin_44083579/article/details/138372355

版权

busybox工具和linux指令学习专栏收录该内容

99 篇文章 0 订阅

订阅专栏

本文详细介绍了Linux中的csplit命令，包括其功能、模式参数的详细解释、文件分割示例以及与Busybox的关系。重点展示了如何按行、正则表达式、数字长度和重复规则分割文件，以及相关选项如输出文件命名、静默模式等。

摘要由CSDN通过智能技术生成

内容来源：

【GUN】【csplit】指令介绍

【busybox】【csplit】指令介绍

【linux】【csplit】指令介绍

使用示例：

分割文件 - 指定文件前缀，后缀，按指定行分割成两个

分割文件 - 指定文件前缀，后缀，按指定行分割成多个

分割文件 - 指定文件前缀，指定名字中数字的长度

分割文件 - 指定文件前缀，使用匹配模式，匹配行（+-N行）之前的输出文件，匹配行后的输出文件

分割文件 - 指定文件前缀，使用匹配模式，匹配行之前的输出文件，匹配行后的输出文件

分割文件 - 指定文件前缀，使用匹配模式，匹配行之前的输出文件，匹配行后的输出文件，不同规则匹配，生成多个文件

分割文件 - 指定文件前缀，使用匹配模式，匹配行之前的输出文件，匹配行后的输出文件，同一规则多次匹配

分割文件 - 指定文件前缀，使用匹配模式，匹配行之前的输出文件，匹配行后的输出文件，同一规则匹配整个文件

分割文件 - 指定文件前缀，使用匹配模式，只输出匹配行后的文件

分割文件 - 指定文件前缀，使用匹配模式，只输出匹配行后的文件，同一规则匹配整个文件

分割文件 - 指定文件前缀，使用匹配模式，匹配行之前的输出文件，匹配行后的输出文件，匹配整个文件，但是不输出匹配行

分割文件 - 静默模式，不打印分割后文件大小，默认打印

常用组合指令：

指令不常用/组合用法还需继续挖掘：

内容来源：

GUN ： Coreutils - GNU core utilities

busybox v1.36.1 ：【busybox记录】【shell指令】基于的Busybox的版本和下载方式-CSDN博客

【GUN】【csplit】指令介绍

csplit:将文件分割为上下文确定的片段
csplit 创建零个或多个包含输入部分的输出文件(如果input为'-'，则为标准输入)。
简介:
csplit [option]... input pattern...
输出文件的内容由模式参数决定，详情如下。
	如果模式参数引用了输入文件中不存在的一行(例如，没有剩余的行与给定的正则表达式匹配)，则会发生错误。
	匹配完所有模式后，将剩余的输入复制到最后一个输出文件中。
	默认情况下，csplit在创建输出文件后打印写入每个输出文件的字节数。

模式参数的类型如下：
‘n’ 
	创建一个输出文件，其中包含从第n行开始但不包括第n行(一个正整数)的输入。如果后面是重复计数，则每次重复都创建一个输出文件，其中包含输入文件的下n行。
‘/regexp/[offset]’
	创建一个输出文件，其中包含当前行，直到(但不包括)下一行匹配regexp的输入文件。
	可选的偏移量是一个整数，可以在前面加上'+'或'-'。如果指定了，则输入直到(但不包括)匹配的加减偏移量的行被放入输出文件中，在匹配的加减偏移量之后的行开始下一段输入。
	在regexp模式的负偏移量内的行在后续的regexp模式中不匹配。
‘%regexp%[offset]’
	与前一个类型类似，不同之处在于它不创建输出文件，因此输入文件的那部分实际上被忽略了。
‘{repeat-count}’
	重复前面的模式repeat-count额外的次数。repeat-count可以是一个正整数，也可以是一个星号，这意味着需要重复多次，直到耗尽输入。

输出文件的名称由前缀(默认为`xx`)和后缀组成。默认情况下，后缀是两位小数的升序序列，从'00'到'99'。
在任何情况下，按照文件名的排序顺序连接输出文件都会生成原始的输入文件，不包括用%regexp%模式或--suppress-matched选项跳过的部分。
默认情况下，如果csplit遇到错误或接收到挂起、中断、退出或终止信号，它将在退出之前删除它迄今为止创建的任何输出文件。
该程序接受以下选项。参见第2章[常见选项]，第2页。

‘-f prefix’
‘--prefix=prefix’
	使用prefix作为输出文件名的前缀。
‘-b format’
‘--suffix-format=format’
	使用format作为输出文件名的后缀。指定此选项时，后缀字符串必须包含一个printf(3)风格的转换规范，可能包括格式规范标志、字段宽度、精度规范或所有这些类型的修饰符。
	格式字母必须将二进制无符号整数参数转换为可读形式。格式字母`d`和`i`是`u`的别名，并且允许`u`、`o`、`x`和`X`的转换。
	整个格式(连同当前输出文件编号)提供给sprintf(3)，以依次形成每个单独输出文件的文件名后缀。如果使用了这个选项，--digits选项将被忽略。
‘-n digits’
‘--digits=digits’
	使用包含数字长度的输出文件名，而不是默认的2。
‘-k’
‘--keep-files’
	遇到错误时不要删除输出文件。
‘--suppress-matched’
	不要输出与指定模式匹配的行。也就是说，从第二次和后续分割的开始抑制边界线。
‘-z’
‘--elide-empty-files’
	禁止生成零长度输出文件。(如果输入文件的节定界符用于标记每个节的第一行，则第一个输出文件通常为零长度文件，除非使用此选项。)输出文件序列号总是从0开始连续运行，即使指定了这个选项。
‘-q’
‘--silent’
‘--quiet’ 
	不打印输出文件大小的计数。

退出状态为零表示成功，非零值表示失败。
下面是它的用法示例。首先，为练习创建一个空目录，并cd到其中:

$ mkdir d && cd d
Now, split the sequence of 1..14 on lines that end with 0 or 5:
$ seq 14 | csplit - '/[05]$/' '{*}'
8
10
15
Each number printed above is the size of an output file that csplit has just created. List the names of those output files:
$ ls
xx00 xx01 xx02
Use head to show their contents:
$ head xx*
==> xx00 <==
1
2
3
4
==> xx01 <==
5
6
7
8
9
==> xx02 <==
10
11
12
13
14
Example of splitting input by empty lines:
$ csplit --suppress-matched input.txt '/^$/' '{*}'

【busybox】【csplit】指令介绍

【linux】【csplit】指令介绍

[root@localhost bin]# csplit --help
用法：csplit [选项]... 文件 格式...
Output pieces of FILE separated by PATTERN(s) to files 'xx00', 'xx01', ...,
and output byte counts of each piece to standard output.

如果文件为“-”，则读取标准输入。

必选参数对长短选项同时适用。
  -b, --suffix-format=FORMAT  use sprintf FORMAT instead of %02d
  -f, --prefix=PREFIX        use PREFIX instead of 'xx'
  -k, --keep-files           do not remove output files on errors
      --suppress-matched     suppress the lines matching PATTERN
  -n, --digits=数位		使用指定的进制数位代替二进制
  -s, --quiet, --silent	不显示输出文件的尺寸计数
  -z, --elide-empty-files	删除空的输出文件
      --help		显示此帮助信息并退出
      --version		显示版本信息并退出

Each PATTERN may be:
  INTEGER            copy up to but not including specified line number
  /REGEXP/[OFFSET]   copy up to but not including a matching line
  %REGEXP%[OFFSET]   skip to, but not including a matching line
  {INTEGER}          repeat the previous pattern specified number of times
  {*}                repeat the previous pattern as many times as possible

A line OFFSET is a required '+' or '-' followed by a positive integer.

GNU coreutils 在线帮助：<https://www.gnu.org/software/coreutils/>
请向 <http://translationproject.org/team/zh_CN.html> 报告 csplit 的翻译错误
完整文档请见：<https://www.gnu.org/software/coreutils/csplit>
或者在本地使用：info '(coreutils) csplit invocation'