cut-从文本流中提取文本列

cut:
        从一个文本文件或者文本流中提取文本列


语法格式:
        cut -b list [-n] [file ...]
        cut -c list [file ...]
        cut -f list [-d delim] [-s] [file ...]


参数说明:
        -b: 以字节为单位进行分割
        -c: 以字符为单位进行分割
        -f: 以域为单位进行分割, 与-d参数一起使用来指定分割符. 除非指定了-s参数,否则即使不包含-d所指定的分割符也会打印出来。
        -d: 自定义分割符, 默认为制表符. 
        -n: 取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的<br />范围之内,该字符将被写出;
            否则,该字符将被排除。-n用于告诉cut不要将多字节字符拆开.


        --output-delimiter=STRING: 把输出的分界符的用STRING替换;  --output-delimiter参数只限于对域分割时才有效(-f)
        -s, --only-delimited: 
            do not print lines not containing delimiters


list表示-b, -c, -f取值的范围. 以上参数(除-n外)分割字节或字符的个数。范围模式如下:
                 n-: 从第n项一直到行尾
                 n-m: 从第n项到第m项(包括m)
                 -m: 从一行的开始到第m项(包括m)
                 -: 从一行的开始到结束的所有项
      
缺点:
    如果文件里面的某些域是由若干个空格来间隔的, 那么用cut就不好处理了.


示例:
who | cut -b 3      提取每一行的第3个字节


who | cut -b 3-5,8  提取每一行的第3,第4,第5和第8个字节


who | cut -c 3-5,8  提取每一行的第3,第4,第5和第8个字符(提取单字节字符 \
                    时与-b效果一样, 但提取多字节字符时就一样了)


cat /etc/passwd | head -n 5 | cut -d ':' -f 1,3-5,7
    把一行的数据按:分隔, 再提取第1列, 第3, 第4, 第5和第7列数据


cat /etc/passwd | head -n 5 | cut -f1,2 -d ':' --output-delimiter='\'
    把一行的数据按:分隔,提取第1,第2列, 然后再用\来做定界符.


cut -f1-4 -d ' ' -s if.sh
    打印按-d指定的定界符分割的行的第1至第4列, 但要求行数据要全部是按 \
    ' '分割的.


cat /etc/passwd | head -n 5 | cut -f1-4 -d ':' --output-delimiter=','
    把/etc/passwd/中按:分隔的第1至第4列出来, 其中把:替换成,


cat /etc/passwd | head -n 5 | cut -s -f1- 
    过滤掉不能TAB键分割的数据行.






上面测试用到的文件:
# filename: if.sh
#! /bin/bash
name="linux"
if [ $namename == "linux" ]
then
    echo "hell, $name"
fi
    
#filename cut_ch.txt
 星期一
星期二
星期三
星期四


[rocrocket@rocrocket programming]$ cat cut_ch.txt
星期一
星期二
星期三
星期四
[rocrocket@rocrocket programming]$ cut -b 3 cut_ch.txt




[rocrocket@rocrocket programming]$ cut -c 3 cut_ch.txt






当遇到多字节字符时,可以使用-n选项,-n用于告诉cut不要将多字节字符拆开。不加则按字节来分割。另说明一下;中文占用三个字节


[rocrocket@rocrocket programming]$ cat cut_ch.txt |cut -b 2




[rocrocket@rocrocket programming]$ cat cut_ch.txt |cut -nb 2


[rocrocket@rocrocket programming]$ cat cut_ch.txt |cut -nb 1,2,3






参考资料:
http://blog.chinaunix.net/uid-20749043-id-1878322.html
http://roclinux.cn/?p=1328
http://os.51cto.com/art/201108/283501_all.htm


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值