Linux学习笔记(八)—— 简单的文本处理

简单的文本处理

tr

tr命令可以用来删除一段文本信息中的某些文字或者将其进行转换。
在这里插入图片描述
【命令解释】

tr [option] ... set1 [set2]
-d: 删除和set1匹配的字符
-s:去除set1指定的在输入文本中连续并重复的字符
tr '[a-z]' '[A-Z]' 将小写转大写

col

col命令可以将Tab键换成等数量的空格键,或者反转这个操作。

在这里插入图片描述

【命令解释】

cat -A 将隐藏符显示出来
col -x 将Tab键替换成空格
col -h 将空格替换成Tab

join

Join命令用于将两个文件中,指定栏内容相同的行连接起来。

在这里插入图片描述【命令解释】

-t 指定连接内容时的分隔符

在这里插入图片描述

-1 4指明第一个文件要用第4个字段,默认为第一个字段
-2 3 指明第二个文件要用第3个字段。

paste

paste命令用于把每个文件以列队列的方式,一列列地加以合并
在这里插入图片描述
【命令解释】

-d  指定合并时的分隔符,默认为Tab
-s 表示不合并到一行,每个文件为一行

练习

1、在《文件打包与解压缩》一节实验中提到 Windows/dos 与 Linux/UNIX 文本文件一些特殊字符不一致

如断行符 Windows 为 CR+LF(\r\n),Linux/UNIX 为 LF(\n)。使用cat -A 文本 可以看到文本中包含的不可见特殊字符。Linux 的\n表现出来就是一个 , 而 W i n d o w s / d o s 的 表 现 为 M ,而 Windows/dos的表现为^M Windows/dosM,可以直接使用dos2unix和unix2dos工具在两种格式之间进行转换,使用file命令可以查看文件的具体类型。

不过现在希望你在不使用上述两个转换工具的情况下,使用前面学过的命令手动完成 dos 文本格式到 UNIX 文本格式的转换。

在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值