linux 命令:cut 详解

cut 命令的功能是对文件中的字段进行截取。

用法:cut OPTION... [FILE]...

选项:

-b, --bytes=LIST                以字节为单位截取

-c, --characters=LIST         以字符为单位截取

-d, --delimiter=DELIM         定义字段分隔符

-f, --fields=LIST                 只保留指定的字段,如果不指定 -s 选项,也打印任何不包含分                                           隔符的行

-n                                       和 -b 一起使用,不拆分多字节字符

--complement                  补充所选字节、字符或字段的集合

-s, --only-delimited              不打印没有字段分隔符的行

--output-delimiter=STRING 使用 STRING 作为输出分隔符 默认是使用输入分隔符

-z, --zero-terminated           去掉行分隔符,默认是换行符

--help                                   打印帮助文档

--version                               打印版本信息

在使用 -b -c -f 之一时,LIST是一个范围,或者是用逗号分隔的多个范围:

N        第 N 个字节、字符、字段,从 1 开始数

N-       从第 N 个字节、字符、字段到行末

N-M    从第 N 到 M (包括) 个字节、字符、字段

-M       从第 1 到 M (包括) 个字节、字符、字段 

使用示例:

我们对储存用户信息的文件/etc/passwd 进行查看:

[root@server ~]# head -5 /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

对英文字母进行操作时,-b 和 -c 的效果一致,因为一个英文字母占一个字节:

# 第3个字节
[root@server ~]# head -5 /etc/passwd | cut -b3
o
n
e
m
:

# 第5,6字节
[root@server ~]# head -5 /etc/passwd | cut -b5,6
:x
x:
on
x:
:4

# 第3个字符
[root@server ~]# head -5 /etc/passwd | cut -c3
o
n
e
m
:

# 第5,6字符
[root@server ~]# head -5 /etc/passwd | cut -c5,6
:x
x:
on
x:
:4

-f的使用: 

# 未指定字段分隔符,默认为空格,所以输出了整行
[root@server ~]# head -5 /etc/passwd | cut -f1
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

# 第1字段
[root@server ~]# head -5 /etc/passwd | cut -d":" -f1
root
bin
daemon
adm
lp

# 从开头到第5字段
[root@server ~]# head -5 /etc/passwd | cut -d":" -f-5
root:x:0:0:root
bin:x:1:1:bin
daemon:x:2:2:daemon
adm:x:3:4:adm
lp:x:4:7:lp

# 从第1字段到第4字段
[root@server ~]# head -5 /etc/passwd | cut -d":" -f1-4
root:x:0:0
bin:x:1:1
daemon:x:2:2
adm:x:3:4
lp:x:4:7

测试一个包含汉字的文件 :

[root@server ~]# cat hanzi
汉堡
薯条
可乐
鸡块
奶昔

# 使用字节模式,显示乱码
[root@server ~]# cut -b1 hanzi
�
�
�
�
�

# 改为字符模式,正常输出
[root@server ~]# cut -c1 hanzi
汉
薯
可
鸡
奶
[root@server ~]# cut -c2 hanzi
堡
条
乐
块
昔

# 也可以使用 -nb, 功能是将多字节的字符(比如汉字)看成整体
[root@server ~]# cut -nb1 hanzi
汉
薯
可
鸡
奶
[root@server ~]# cut -nb2 hanzi
堡
条
乐
块
昔
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值