3.3.1 常用文本的处理工具

文件查看工具

    cat命令用于查看文件中的内容。tac可以反向查看文件。

    语法:cat [选项] [文件]

    选项

-E: 显示行结束符$
-n: 对显示出的每一行进行编号
-A:显示所有控制符
-b:非空行编号
-s:压缩连续的空行成一行
[root@CentOS6 ~]# cat -An .bashrc
     1	# .bashrc$
     2	$
     3	# User specific aliases and functions$
     4	$
     5	alias rm='rm -i'$
     6	alias cp='cp -i'$
     7	alias mv='mv -i'$
     8	alias shc='shutdown -c'$
     9	alias grep='grep --color=auto'$
    10	$
    11	# Source global definitions$
    12	if [ -f /etc/bashrc ]; then$
    13	^I. /etc/bashrc$
    14	fi$
    15	umask 0022$

    more命令用于分页查看文件。

    less命令用于分页查看文件,man命令使用的分页器。

    语法:less [选项] 文件

    选项

-e:文件内容显示完毕后,自动退出;
-f:强制显示文件;
-g:不加亮显示搜索到的所有关键词,仅显示当前显示的关键字,以提高显示速度;
-l:搜索时忽略大小写的差异;
-N:每一行行首显示行号;

-s:将连续多个空行压缩成一行显示;

    操作

/字符串:向下搜索"字符串"的功能 
?字符串:向上搜索"字符串"的功能 
n:重复前一个搜索(与 / 或 ? 有关) 
N:反向重复前一个搜索(与 / 或 ? 有关)  
d 向后翻半页
u 向前滚动半页 
回车键 滚动一行
空格键 滚动一页 
G - 移动到最后一行 
g - 移动到第一行
q / ZZ - 退出 less 命令

    head命令用于查看文件的开头内容。

    语法:head [选项] 文件

    选项

    -n 行数       -c 字节数

[root@CentOS6 etc]# head -n 3 /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin

    tail命令用于查看文件的结尾内容。

    语法:tail [选项] 文件

    选项

-c #: 指定获取后#字节
-n #: 指定获取后#行

-f: 跟踪显示文件fd新追加的内容,常用日志监控    -F: 跟踪文件名

-f选项只会跟踪文件的文件描述符,所以当文件位置改变时不会提示文件不存在,但-F跟踪的是文件名,当文件被删除时会提示文件不存在,如果新建一个同名文件则会继续跟踪。

    cut命令用于显示或者删除指定部分。

    语法:cut [选项] 文件

    选项

-d : 指明分隔符,默认tab
-f :指定匹配字段的次数
-c 按字符数切割
--output-delimiter=STRING指定输出分隔符
利用passwd显示前三行用户的所属组

[root@CentOS7 ~]# getent passwd | head -3 | cut -d: -f5
root
bin
daemon

    paste命令用于将两个文件中同行号的列合并到一行。

    语法:paste [选项] 文件 文件

    选项

-d 分隔符:指定分隔符,默认用TAB

-s : 所有行合成一行显示

文件分析工具

    wc命令用于统计文件的数据。

    语法:wc [选项] 文件

    选项

-l 统计行数
-w 统计单词总数
-c 统计字节总数
-m 统计字符总数

-L 显示文件中最长行的长度

[root@CentOS7 ~]# wc -l /etc/passwd
45 /etc/passwd

    sort命令用于将文件内容进行排序,并输出到STDOUT。

    语法:sort [选项] 文件

    选项

-r 执行反方向(由上至下)整理
-R 随机排序
-n 执行按数字大小整理
-f 忽略字符串中的字符大小写
-u 删除输出中的重复行
-t c 选项使用c做为字段界定符

-k X 选项按照使用c字符分隔的X列来整理能够使用多次

[root@CentOS7 ~]# cat -n .bashrc | sort -rn
    12	fi
    11		. /etc/bashrc
    10	if [ -f /etc/bashrc ]; then
     9	# Source global definitions
     8	
     7	alias mv='mv -i'
     6	alias cp='cp -i'
     5	alias rm='rm -i'
     4	
     3	# User specific aliases and functions
     2	
     1	# .bashrc

    uniq命令用于删除文件中前后相接且相同的行。

    语法:uniq [选项] 文件

    选项

-c: 显示每行重复出现的次数
-d: 仅显示重复过的行
-u: 仅显示不曾重复的行

文件处理工具

    grep命令用于使用正则表达式对文件搜索,并将结果打印出来。

    语法:grep [选项] 模式 文件

    选项

-v: 显示不被pattern匹配到的行
-i: 忽略字符大小写
-n:显示匹配的行号
-c: 统计匹配的行数
-o: 仅显示匹配到的字符串
-q: 静默模式,不输出任何信息
-A #: 后#行
-B #: 前#行
-C #:前后各#行
-e:实现多个选项间的逻辑or关系
-w:匹配整个单词

    vim工具用于文本处理或者程序设计。

    基本上vim一共分为三种模式:命令模式(Command)、输入模式(Insert)、扩展模式(Extended)。


命令模式

    用户在一开始进入vim,便进入了命令模式。在命令模式下输入的都是命令,并不是字符,常用的有:i、a、o

i: insert, 在光标所在处输入
I:在当前光标所在行的行首输入
a: append, 在光标所在处后面输入
A:在当前光标所在行的行尾输入
o: 在当前光标所在行的下方打开一个新行

O:在当前光标所在行的上方打开一个新行

扩展模式

    在命令模式下输入":"则进入扩展模式。可用的命令有很多,基本的命令有

:q 退出
:q! 强制退出,丢弃做出的修改
:wq 保存退出

:x 保存退出


正则表达式

    正则表达式是一种文本格式,用于匹配一类符合某种语法规则的字符串。分为:基本正则表达式和扩展正则表达式。


    扩展的正则表达式向后引用与锚定单词以外,可以不加转义符“\”。

利用df和grep,取出磁盘各分区利用率,并从大到小排序

df | grep "sda." | grep -o "[0-9]\+%" | sort -rn


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值