使用说明:
cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。
如果不指定 File 参数,cut 命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一。
参数:
-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。
-c :以字符为单位进行分割。
-d :自定义分隔符,默认为制表符。
-f :与-d一起使用,指定显示哪个区域。
-n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的
范围之内,该字符将被写出;否则,该字符将被排除
实验:
创建文件 内容如下:
11 Tom computer-science 4.0
12 Jack economic 3.8
13 Marry biology 3.9
14 Cherry mathematics 4.1
15 Jim chemistry 4.2
1.提取文件中的人名
#cut -d 必须配合 -f 否则报错
(base) [gbkxyjzx@g3501 test]$ cut -d' ' -f2 cut.test
Tom
Jack
Marry
Cherry
Jim
2.提取多个字段
(1)-f field_list:field_list为字段列表,指定需要提取的字段。
(2)-f N-:指从第N个字段到行尾。
(3)-f N-M:指从第N个字段到第M个字段。
(4)-f -N:指从行首到第N个字段。
(5) -f N,M:提取第N和第M字段
#提取第二列至末尾
(base) [gbkxyjzx@g3501 test]$ cut -d' ' -f 2- cut.test
Tom computer-science 4.0
Jack economic 3.8
Marry biology 3.9
Cherry mathematics 4.1
Jim chemistry 4.2
#提取从开始到第2列
(base) [gbkxyjzx@g3501 test]$ cut -d' ' -f -2 cut.test
11 Tom
12 Jack
13 Marry
14 Cherry
15 Jim
#提取第2-4
(base) [gbkxyjzx@g3501 test]$ cut -d' ' -f 2-4 cut.test
Tom computer-science 4.0
Jack economic 3.8
Marry biology 3.9
Cherry mathematics 4.1
Jim chemistry 4.2
#提取第二列和第4列
(base) [gbkxyjzx@g3501 test]$ cut -d' ' -f 2,4 cut.test
Tom 4.0
Jack 3.8
Marry 3.9
Cherry 4.1
Jim 4.2
3.按照字符号分割
(base) [gbkxyjzx@g3501 test]$ cut -c 1-6 cut.test
11 Tom
12 Jac
13 Mar
14 Che
15 Jim
4.按照字节分割
只有在针对汉字的时候才可以体现出效果,因为一个汉字占用3个字节,如果只输出一个字节,则不会显示内容
(base) [gbkxyjzx@g3501 test]$ cut -b 1-6 cut.test
11 Tom
12 Jac
13 Mar
14 Che
15 Jim