Linux下cut命令用法详解(原创:frozen_sucker(冰棍))

有时我们经常会遇到这样一些问题:有一页电话号码薄,上面按顺序规则地写着人名、家庭住址、电话、备注等,此时我们只想取出所有人的名字和其对应的电话号码,你有几种方法可以实现呢

确实这种纵向定位的方式用常规办法难以实现,这时,cut 就可以大显身手了。

What’s cut?

子曰:cut 命令可以从一个文本文件或者文本流中提取文本列。

命令用法:

       cut -b list [-n] [file ...]

       cut -c list [file ...]

       cut -f list [-d delim][-s][file ...]

l      上面的-b 、-c 、-f 分别表示字节、字符、字段(即byte 、character 、field );

l      list 表示-b 、-c 、-f 操作范围,-n 常常表示具体数字;

l      file 表示的自然是要操作的文本文件的名称;

l      delim (英文全写:delimiter )表示分隔符,默认情况下为TAB ;

l      -s 表示不包括那些不含分隔符的行(这样有利于去掉注释和标题)

上面三种方式中,表示从指定的范围中提取字节(-b )、或字符(-c )、或字段(-f )。

范围的表示方法:

N

只有第N项

N-

从第N项一直到行尾

N-M

从第N项到第M项(包括M)

-M

从一行的开始到第M项(包括M)

-

从一行的开始到结束的所有项

下面是实例,先以较简单的“命令用法”中提及的第二条开始讲起:

interrupts 文件中的字符排列非常齐整,正适合我们切豆腐。

但这里我们只对两个数字列感兴趣,用法如下:

里面还有一些不需要的内容,精减一下:

关于正则表达式的使用,请自行查阅相关资料。

 

合到一起:

哇,果然够帅!!

不相邻列的截选又应该如何做呢?

这种方式需要事先确定占多少个字符位置,不仅麻烦,而且容易出错。

下面的问题该怎么去做?

这就是第二讲:使用cut –f 提取文本中的字段。

cut –c 主要是用来在固定字符位置或个数的文本文件中提取,对于上面的例子就显得无能为力了。仔细观察,发现passwd 文件有个规律,就是以冒号来区分不同的段的文本,于是。。。

怎么样,好玩吧~!

继续,创建一个文本文件,名为a.txt ,名字有点土,凑合着用吧。

A1 、B1 、C1 所代表的行字符之间均以TAB 分隔,D1 却是以空格来分开的。

 

看到-s 的作用了吗?( 因为第一行不含有任何TAB 字符,所以直接被剔除了) ,而最后一行( 即D1 行) ,是以空格区分间距,所以也不合要求。

 

多了个参数,这个我没讲,只要你认为自己不傻,就自己猜吧。

 

好了,下面是最后一个用法的讲解了:

 

因为虚拟终端下无法显示汉字,所以我只好回到图形下,截图就成这个白不垃圾的样子啦,忍忍吧,就快讲完了。

在这个文件中,每个汉字都是用半角空格分隔的。

 

 

用cut –c 已经成功了,下面试试cut –b 怎么样?

没有反应,why ?

 

原因在于汉字本身是双字节的,cut –c 把汉字“我”当成一个字符来处理,而cut –b 是以字节来处理,把“我”拆成了两个字节,结果是字符被“切成两半”,因此无法正常显示。

原因找到了,要怎么办才好呢?

 

耶!!! 搞定。

OK ,all is done 。就到这里吧,休息,休息。。。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值