linux分隔符tab,科学网-Linux/BSD下join命令使数据以tab为分隔符的方法-李雷廷的博文...

[join命令可以通过-t $'t'来把分隔符设为tab字符]

默认情况下,Linux/BSD下的join命令以空格为分隔符。即使你的输入文件是以tab为分隔符的,输出文件也会变成以一个空格为分隔的文件。假如你的数据中存在有空格的字符串,输出结果就会变得混乱,比如:

file1.txt

a        hello

b        join me

file2.txt

a        a b c

b        file

这样的两个文件用命令“join file1.txt join file2.txt”合并后会变成

a hello a b c

b join me file

这样就会难以确定第二列的内容,造成混乱。

考虑到这一点,需要用join的一个参数来确定分隔符,即-t,但是从直觉上的几种使用方法都是不对的,比如

join -t "t" file1.txt file2.txt

join -t"t" file1.txt file2.txt

join -t 't' file1.txt file2.txt

join -t't' file1.txt file2.txt

这样使用会报错,“join: multi-character tab '\t'”(Linux), 或“join: illegal tab character specification” (BSD)。

事实上,这里是因为bash不会把"t"解读为tab键,而把它看成是两个字符——反斜线和t。我同时测试了cut命令,反应与join命令是一样的。

当然,这个问题不会无解,只是我们没有使用正确的用法,正确的用法是用$''来包括t,也就是

join -t $'t' file1.txt file2.txt

双引号是不行的。这说明bash需要的特定的方法来解读反义字符。

这里有一点疑问,就是为什么join 和 cut 之类的命令只支持单字符的分隔符,而且为什么不做一个快捷方式,能够直接解读"t"为tab符号。我想这可能是由于历史原因,或着速度的考量吧,不得而知。

参考资料:

http://stackoverflow.com/questions/8849681/bash-join-command

转载本文请联系原作者获取授权,同时请注明本文来自李雷廷科学网博客。

收藏

分享

分享到:

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值