linux命令整理3:文件处理命令

一、文件处理命令

filegrepddfindmvlsdiffcatlnwc

二、命令详解:

file
1.
作用件内容判断文件类型,使用权限是所有用户。
2.
格式
file
通过探测文
file [options]
文件名
3.[options]
主要参数
-v
:在标准输出后显示版本信息,并且退出。
-z
:探测压缩过的文件类型。
-L
:允许符合连接。
-f name
:从文件namefile中读取要分析的文件名列表。
4.
简单说明
使用file命令可以知道某个文件究竟是二进制(ELF格式)的可执行文件, 还是Shell Script文件,或者是其它的什么格式。file能识别的文件类型有目录、Shell脚本、英文文本、二进制可执行文件、C语言源文件、文本文件、DOS的可执行文件。
5.
应用实例
如果我们看到一个没有后缀的文件grap,可以使用下面命令:
$ file grap
grap
English text
此时系统显示这是一个英文文本文件。需要说明的是,file命令不能探测包括图形、音频、视频等多媒体文件类型。

grep
1.
作用
grep
命令可以指定文件中搜索特定的内容,并将含有这些内容的行标准输出。grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。
2.
格式
grep [options]
3.
主要参数
[options]
主要参数:
c:只输出匹配行的计数。
I:不区分大小写(只适用于单字符)。
h:查询多文件时不显示文件名。
l:查询多文件时只输出包含匹配字符的文件名。
n:显示匹配行及行号。
s:不显示不存在或无匹配文本的错误信息。
v:显示不包含匹配文本的所有行。
pattern
正则表达式主要参数:
\
:忽略正则表达式中特殊字符的原有含义。
^
:匹配正则表达式的开始行。
$:
匹配正则表达式的结束行。
\
:到匹配正则表达式的行结束。
[ ]
:单个字符,如[A]A符合要求
[ - ]
:范围,如[A-Z],即ABC一直到Z都符合要求
。:所有的单个字符。
*
:有字符,长度可以为0
正则表达式是Linux/Unix系统中非常重要的概念。正则表达式(也称为“regex”“regexp”)是一个可以描述一类字符串的模式(Pattern)。如果一个字符串可以用某个正则表达式来描述,我们就说这个字符和该正则表达式匹配(Match)。这和DOS中用户可以使用通配符“*”代表任意字符类似。在Linux系统上,正则表达式通常被用来查找文本的模式,以及对文本执行搜索-替换操作和其它功能。
4.
应用实例
查询DNS服务是日常工作之一,这意味着要维护覆盖不同网络的大量IP地址。有时IP地址会超过2000个。如果要查看nnn.nnn网络地址,但是却忘了第二部分中的其余部分,只知到有两个句点,例如nnn nn..。要抽取其中所有nnn.nnn IP地址,使用[09 ]\{3
\}\.[0
0\{3\}\。含义是任意数字出现3次,后跟句点,接着是任意数字出现3次,后跟句点。

$grep '[0
9 ]\{3 \}\.[00\{3\}\' ipfile
补充说明,grep家族还包括fgrepegrepfgrepfix grep,允许查找字符串而不是一个模式;egrep是扩展grep,支持基本及扩展的正则表达式,但不支持\q模式范围的应用及与之相对应的一些更加规范的模式。

dd
1.
作用
dd
命令用来复制文件,并根据参数将数据转换和格式化。
2.
格式
dd [options]
3.[opitions]
主要参数
bs=
字节:强迫 ibs=obs=
cbs=
字节:每次转换指定的。
conv=
关键字:根据以逗号分隔的关键字表示的方式来转换文件。
count=
块数目:只复制指定的输入数据。
ibs=
字节:每次读取指定的。
if=
文件:读取内容,而非标准输入的数据。
obs=
字节:每次写入指定的。
of=
文件:将数据写入,而不在标准输出显示。
seek=
块数目:先略过以obs为单位的指定的输出数据。
skip=
块数目:先略过以ibs为单位的指定的输入数据。
4.
应用实例
dd
命令常常用来制作Linux启动盘。先找一个可引导内核,令它的根设备指向正确的根分区,然后使用dd命令将其写入软盘:
$ rdev vmlinuz /dev/hda
$dd if
vmlinuz of/dev/fd0
上面代码说明,使用rdev命令将可引导内核vmlinuz中的根设备指向/dev/hda,请把“hda”换成自己的根分区,接下来用dd命令将该内核写入软盘。

find
1.
作用
find
命令的作用是在目录中搜索文件,它的使用权限是所有用户。
2.
格式
find [path][options][expression]
path
指定目录路径,系统从这里开始沿着目录树向下查找文件。它是一个路径列表,相互用空格分离,如果不写path,那么默认为当前目录。
3.
主要参数
[options]
参数:
depth:使用深度级别的查找过程方式,在某层指定目录中优先查找文件内容。
maxdepth levels:表示至多查找到开始目录的第level层子目录。level是一个非负数,如果level0的话表示仅在当前目录中查找。
mindepth levels:表示至少查找到开始目录的第level层子目录。
mount:不在其它文件系统(如MsdosVfat等)的目录和文件中查找。
version:打印版本。
[expression]
是匹配表达式,是find命令接受的表达式,find命令的所有操作都是针对表达式的。它的参数非常多,这里只介绍一些常用的参数。
—name
:支持统配符*?
atime n:搜索在过去n天读取过的文件。
ctime n:搜索在过去n天修改过的文件。
group grpoupname:搜索所有组为grpoupname的文件。
user 用户名:搜索所有文件属主为用户名(ID或名称)的文件。
size n:搜索文件大小是nblock的文件。
print:输出搜索结果,并且打印。
4.
应用技巧
find
命令查找文件的几种方法:
1)根据文件名查找
例如,我们想要查找一个文件名是lilo.conf的文件,可以使用如下命令:
find /
name lilo.conf
find
命令后的“/”表示搜索整个硬盘。

2)快速查找文件
根据文件名查找文件会遇到一个实际问题,就是要花费相当长的一段时间,特别是大型Linux文件系统和大容量硬盘文件放在很深的子目录中时。如果我们知道了这个文件存放在某个目录中,那么只要在这个目录中往下寻找就能节省很多时间。比如smb.conf文件,从它的文件后缀“.conf”可以判断这是一个配置文件,那么它应该在/etc目录内,此时可以使用下面命令:
find /etc
name smb.conf
这样,使用快速查找文件方式可以缩短时间。

3)根据部分文件名查找方法
有时我们知道只某个文件包含有abvd4个字,那么要查找系统中所有包含有这4个字符的文件可以输入下面命令:
find /
name '*abvd*'
输入这个命令以后,Linux系统会将在/目录中查找所有的包含有abvd4个字符的文件(其中*是通配符),比如abvdrmyz等符合条件的文件都能显示出来。

(4)
使用混合查找方式查找文件
find
命令可以使用混合查找的方法,例如,我们想在/etc目录中查找大于500000字节,并且在24小时内修改的某个文件,则可以使用-and ()把两个查找参数链接起来组合成一个混合的查找方式。
find /etc -size +500000c -and -mtime +1
mv
1.
作用
mv
命令用来为文件或目录改名,或者将文件由一个目录移入另一个目录中,它的使用权限是所有用户。该命令如同DOS命令中的renmove的组合。
2.
格式
mv[options]
源文件或目录目标文件或目录
3.[options]
主要参数
i:交互方式操作。如果mv操作将导致对已存在的目标文件的覆盖,此时系统询问是否重写,要求用户回答“y”“n”,这样可以避免误覆盖文件。
f:禁止交互操作。mv操作要覆盖某个已有的目标文件时不给任何指示,指定此参数后i参数将不再起作用。
4.
应用实例
1)将/usr/cbu中的所有文件移到当前目录(用“.”表示)中:
$ mv /usr/cbu/ * .
2)将文件cjh.txt重命名为wjz.txt
$ mv cjh.txt wjz.txt
 
ls
1.
作用
ls
命令用于显示目录内容,类似DOS下的dir命令,它的使用权限是所有用户。
2.
格式
ls [options][filename]
3.options
主要参数
a, --all:不隐藏任何以“.” 字符开始的项目。
A, --almostall:列出除了“ . ” “.. ”以外的任何项目。
--author:印出每个文件著作者。
b, --escape:以八进制溢出序列表示不可打印的字符。
--blocksize=大小:块以指定的字节为单位。
B, --ignorebackups:不列出任何以 ~ 字符结束的项目。
f:不进行排序,-aU参数生效,-lst参数失效。
F, --classify:加上文件类型的指示符号 (*/=@| 其中一个)
glike l, but do not list owner
G, --nogroupinhibit display of group information
i, --inode:列出每个文件的inode号。
I, --ignore=样式:不印出任何符合Shell万用字符的项目。
k:即--blocksize=1K
l:使用较长格式列出信息(文件大小,时间,权限)
L, --dereference:当显示符号链接的文件信息时,显示符号链接所指示的对象,而并非符号链接本身的信息。
m:所有项目以逗号分隔,并填满整行行宽。
n, --numericuidgid:类似-l,但列出UIDGID号。
N, --literal:列出未经处理的项目名称,例如不特别处理控制字符。
p, --filetype:加上文件类型的指示符号 (/=@| 其中一个)
Q, --quotename:将项目名称括上双引号。
r, --reverse:依相反次序排列。
R, --recursive:同时列出所有子目录层。
s, --size:以块大小为序。
4.
应用举例
ls
命令是Linux系统使用频率最多的命令,它的参数也是Linux命令中最多的。使用ls命令时会有几种不同的颜色,其中蓝色表示是目录,绿色表示是可执行文件,红色表示是压缩文件,浅蓝色表示是链接文件,加粗的黑色表示符号链接,灰色表示是其它格式文件ls最常使用的是ls -l ,见图1所示。
1 使用ls-l命令


文件类型开头是由10个字符构成的字符串。其中第一个字符表示文件类型,它可以是下述类型之一:-(普通文件)、d(目录)、l(符号链接)、b(块设备文件)、c(字符设备文件)。后面的9个字符表示文件的访问权限,分为3组,每组3位。第一组表示文件属主的权限,第二组表示同组用户的权限,第三组表示其他用户的权限。每一组的三个字符分别表示对文件的读(r)、写(w)和执行权限(x)。对于目录,表示进入权限。若相应的权限位上是­­­-”则表示无此权限。s表示当文件被执行时,把该文件的UIDGID赋予执行进程的UID(用户ID)或GID(组ID)。t表示设置标志位(留在内存,不被换出)。如果该文件是目录,那么在该目录中的文件只能被超级用户、目录拥有者或文件属主删除。如果它是可执行文件,那么在该文件执行后,指向其正文段的指针仍留在内存。这样再次执行它时,系统就能更快地装入该文件。接着显示的是文件大小、生成时间、文件或命令名称。

diff
1.
作用
diff
命令用于两个文件之间的比较,并指出两者的不同,它的使用权限是所有用户。
2.
格式
diff [options]
源文件目标文件
3.[options]
主要参数
-a
:将所有文件当作文本文件来处理。
-b
:忽略空格造成的不同。
-B
:忽略空行造成的不同。
-c
:使用纲要输出格式。
-H
:利用试探法加速对大文件的搜索。
-I
:忽略大小写的变化。
-n --rcs
:输出RCS格式。
cmp
1.
作用
cmp
“compare”的缩写)命令用来简要指出两个文件是否存在差异,它的使用权限是所有用户。
2.
格式
cmp[options]
文件名
3.[options]
主要参数
-l:
将字节以十进制的方式输出,并方便将两个文件中不同的以八进制的方式输出。
cat
1.
作用
cat
“concatenate”的缩写)命令用于连接并显示指定的一个和多个文件的有关信息,它的使用权限是所有用户。
2.
格式
cat [options]
文件1 文件2……
3.[options]
主要参数

n:由第一行开始对所有输出的行数编号。
b:和-n相似,只不过对于空白行不编号。
s:当遇到有连续两行以上的空白行时,就代换为一行的空白行。
4.
应用举例
1cat命令一个最简单的用处是显示文本文件的内容。例如,我们想在命令行看一下README文件的内容,可以使用命令:
$ cat README
 
2
有时需要将几个文件处理成一个文件,并将这种处理的结果保存到一个单独的输出文件。cat命令在其输入上接受一个或多个文件,并将它们作为一个单独的文件打印到它的输出。例如,把READMEINSTALL的文件内容加上行号(空白行不加)之后,将内容附加到一个新文本文件File1 中:
$ cat README INSTALL File1
3cat还有一个重要的功能就是可以对行进行编号,见图2所示。这种功能对于程序文档的编制,以及法律和科学文档的编制很方便,打印在左边的行号使得参考文档的某一部分变得容易,这些在编程、科学研究、业务报告甚至是立法工作中都是非常重要的。图2 使用cat命令/etc/named.conf文件进行编号对行进行编号功能有-b(只能对非空白行进行编号)和-n(可以对所有行进行编号)两个参数:
$ cat -b /etc/named.conf
ln
1.
作用
ln
命令用来在文件之间创建链接,它的使用权限是所有用户。
2.
格式
ln [options]
源文件 [链接名]
3.
参数

f:链结时先将源文件删除。
d:允许系统管理者硬链结自己的目录。
s:进行软链结(Symbolic Link)
b:将在链结时会被覆盖或删除的文件进行备份。
链接有两种,一种被称为硬链接(Hard Link),另一种被称为符号链接(Symbolic Link)。默认情况下,ln命令产生硬链接。硬连接指通过索引节点来进行的连接。在Linux的文件系统中,保存在磁盘分区中的文件不管是什么类型都给它分配一个编号,称为索引节点号(Inode Index)。在Linux中,多个文件名指向同一索引节点是存在的。一般这种连接就是硬连接。硬连接的作用是允许一个文件拥有多个有效路径名,这样用户就可以建立硬连接到重要文件,以防止误删的功能。其原因如上所述,因为对应该目录的索引节点有一个以上的连接。只删除一个连接并不影响索引节点本身和其它的连接,只有当最后一个连接被删除后,文件的数据块及目录的连接才会被释放。也就是说,文件才会被真正删除。
与硬连接相对应,Lnux系统中还存在另一种连接,称为符号连接(Symbilc Link),也叫软连接。软链接文件有点类似于Windows的快捷方式。它实际上是特殊文件的一种。在符号连接中,文件实际上是一个文本文件,其中包含的有另一文件的位置信息。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值