Linux循序渐进(7)

最新推荐文章于 2024-07-09 17:58:15 发布

沙漠里的海豚

最新推荐文章于 2024-07-09 17:58:15 发布

阅读量543

点赞数

分类专栏： linux 工作日记文章标签： linux 正则表达式数据库 shell mina file

工作日记同时被 2 个专栏收录

33 篇文章 0 订阅

订阅专栏

linux

32 篇文章 1 订阅

订阅专栏

第十课(二)文件内容查询命令　　　　
　　grep、fgrep和egrep命令
　　这组命令以指定模式搜索文件，并通知用户在什么文件中搜索到与指定的模式匹配
的字符串，并打印出所有包含该字符串的文本行，在该文本行的最前面是该行所在的文
件名。grep命令一次只能搜索一个指定的模式；egrep命令检索扩展的正则表达式（包括
表达式组和可选项）；fgrep命令检索固定字符串，它不识别正则表达式，是快速搜索命
令。
　　这组命令在搜索与定位文件中特定的主题方面非常有用。要搜索的模式可以被认为
是一些关键词，您可以用它们来搜索文件中包含的这些关键词。编写程序时，可以用它
来寻找某一个函数，或是相关的词组。grep命令的搜索功能比fgrep强大，因为grep命令
的搜索模式可以是正则表达式，而fgrep却不能。有关正则表达式请参见shell一章。
　　该组命令中的每一个命令都有一组选项，利用这些选项可以改变其输出方式。例如
，可以在搜索到的文本行上加入行号，或者只输出文本行的行号，或者输出所有与搜索
模式不匹配的文本行，或只简单地输出已搜索到指定模式的文件名，并且可以指定在查
找模式时忽略大小写。
　　这组命令在指定的输入文件中查找与模式匹配的行。如果没有指定文件，则从标准
输入中读取。正常情况下，每个匹配的行被显示到标准输出。如果要查找的文件是多个
，则在每一行输出之前加上文件名。
　　语法：
　　grep ［选项］［查找模式］［文件名1，文件名2，……］
　　egrep ［选项］［查找模式］［文件名1，文件名2，……］
　　fgrep ［选项］［查找模式］［文件名1，文件名2，……］
　　这组命令各选项的含义为：
　　- E 每个模式作为一个扩展的正则表达式对待。
　　- F 每个模式作为一组固定字符串对待（以新行分隔），而不作为正则表达式。
　　- b在输出的每一行前显示包含匹配字符串的行在文件中的字节偏移量。
　　- c 只显示匹配行的数量。
　　- i 比较时不区分大小写。
　　- h 在查找多个文件时，指示grep不要将文件名加入到输出之前。
　　- l 显示首次匹配串所在的文件名并用换行符将其隔开。当在某文件中多次出现匹
配串时，不重复显示此文件名。
　　- n 在输出前加上匹配串所在行的行号（文件首行行号为1）。
　　- v 只显示不包含匹配串的行。
　　- x 只显示整行严格匹配的行。
　　- e expression 指定检索使用的模式。用于防止以“-”开头的模式被解释为命令
选项。
　　- f expfile 从expfile文件中获取要搜索的模式，一个模式占一行。
　　对该组命令的使用还需注意以下方面：
　　在命令后键入搜索的模式，再键入要搜索的文件。其中，文件名列表中也可以使用
特殊字符，如“*”等，用来生成文件名列表。如果想在搜索的模式中包含有空格的字符
串，可以用单引号把要搜索的模式括起来，用来表明搜索的模式是由包含空格的字符串
组成。否则，Shell将把空格认为是命令行参数的定界符，而grep命令将把搜索模式中的
单词解释为文件名列表中的一部分。在下面的例子中，grep命令在文件example中搜索模
式“text file”。
　　$ grep ’text file’ example
　　　用户可以在命令行上用Shell特殊字符来生成将要搜索的文件名列表。在下面的例
子中，特殊字符“*”用来生成一个文件名列表，该列表包含当前目录下所有的文件。该
命令将搜索出当前目录下所有文件中与模式匹配的行。
　　$ grep data *
　　　特殊字符在搜索一组指定的文件时非常有用。例如，如果想搜索所有的C程序源文
件中特定的模式，您可以用“*.c”来指定文件名列表。假设用户的 C程序中包含一些不
必要的转向语句（goto语句），想要找到这些语句，可以用如下的命令来搜索并显示所
有包含goto语句的代码行：
　　$ grep goto *.c
　　用户可以在命令行上键入搜索模式，也可以使用-f选项从指定文件中读取要搜索的
模式。在文件中，每个搜索模式占一行。如果经常要搜索一组常见字符串时，这个功能
非常有用。在下面的例子中，用户要在文件exam中搜索字符串“editor”和“create”
，就把要搜索的模式放置在文件mypats中，然后，grep命令从文件mypats中读取要搜索
的模式。
　　$ cat mypats
　　editor
　　create
　　$ grep -f mypats exam
　　文件查找命令
　　find命令
　　功能：在目录结构中搜索文件，并执行指定的操作。此命令提供了相当多的查找条
件，功能很强大。
　　语法：find 起始目录寻找条件操作
　　说明：find命令从指定的起始目录开始，递归地搜索其各个子目录，查找满足寻找
条件的文件并对之采取相关的操作。
　　该命令提供的寻找条件可以是一个用逻辑运算符not、and、or组成的复合条件。逻
辑运算符and、or、not的含义为：
　　（1）and：逻辑与，在命令中用“-a”表示，是系统缺省的选项，表示只有当所给
的条件都满足时，寻找条件才算满足。例如：
　　$ find –name ’tmp’ –xtype c -user ’inin’
　　该命令寻找三个给定条件都满足的所有文件。
　　（2）or：逻辑或，在命令中用“-o”表示。该运算符表示只要所给的条件中有一个
满足时，寻找条件就算满足。例如：
　　$ find –name ’tmp’ –o –name ’mina*’
　
　　该命令查询文件名为’tmp’或是匹配’mina*’的所有文件。
　　（3）not：逻辑非，在命令中用“！”表示。该运算符表示查找不满足所给条件的
文件。例如：
　　$ find ! –name ’tmp’
　　该命令查询文件名不是’tmp’的所有文件。
　　需要说明的是：当使用很多的逻辑选项时，可以用括号把这些选项括起来。为了避
免Shell本身对括号引起误解，在话号前需要加转义字符“”来去除括号的意义。
　　例：$ find （–name ’tmp’ –xtype c -user ’inin’ ）
　　寻找条件有以下选项：
　　首先，下列各个选项中的n值可以有三种输入方式，假设n为20，则：
　　+20 表示20以后（21，22，23等）
　　-20 表示20以前（19，18，17等）
　　20 表示正好是20
　　1. 以名称和文件属性查找。
　　- name ’字串’ 查找文件名匹配所给字串的所有文件，字串内可用通配符*、?、
［］。
　　- lname ’字串’ 查找文件名匹配所给字串的所有符号链接文件，字串内可用通配
符*、?、［］。
　　-gid n 查找属于ID号为n的用户组的所有文件。
　　-uid n 查找属于ID号为n的用户的所有文件。
　　-group ’字串’ 查找属于用户组名为所给字串的所有的文件。
　　-user ’字串’ 查找属于用户名为所给字串的所有的文件。
　　-empty 查找大小为0的目录或文件。
　　-path ’字串’ 查找路径名匹配所给字串的所有文件，字串内可用通配符*、?、［
］。
　　-perm 权限查找具有指定权限的文件和目录，权限的表示可以如711，644。
　　-size n［bckw］查找指定文件大小的文件，n后面的字符表示单位，缺省为b，代
表512字节的块。
　　-type x 查找类型为x的文件，x为下列字符之一：
　　b 块设备文件
　　c 字符设备文件
　　d 目录文件
　　p 命名管道（FIFO）
　　f 普通文件
　　l 符号链接文件（symbolic links）
　　s socket文件
　　-xtype x 与-type基本相同，但只查找符号链接文件。
　　2. 以时间为条件查找
　　- amin n 查找n分钟以前被访问过的所有文件。
　　- atime n 查找n天以前被访问过的所有文件。
　　- cmin n 查找n分钟以前文件状态被修改过的所有文件。
　　- ctime n 查找n天以前文件状态被修改过的所有文件。
　　- mmin n 查找n分钟以前文件内容被修改过的所有文件。
　　- mtime n 查找n天以前文件内容被修改过的所有文件。
　　3. 可执行的操作
　　- exec 命令名称 {} 对符合条件的文件执行所给的Linux 命令，而不询问用户是否
需要执行该命令。{}表示命令的参数即为所找到的文件；命令的末尾必须以“ ；”结束
。
　　- ok 命令名称 { } 对符合条件的文件执行所给的Linux 命令，与exec不同的是，
它会询问用户是否需要执行该命令。
　　- ls 详细列出所找到的所有文件。
　　- fprintf 文件名将找到的文件名写入指定文件。
　　- print 在标准输出设备上显示查找出的文件名。
　　- printf 格式格式的写法请参考有关C语言的书。
　　例1：查找当前目录中所有以main开头的文件，并显示这些文件的内容。
　　$ find . - name ‘main*’ - exec more {} ;
　　例2：删除当前目录下所有一周之内没有被访问过的a .out或*.o文件。
　　$ find . （- name a.out - o - name ‘*.o’）
　　> - atime +7 - exec rm {} ;
　　说明如下：
　　命令中的“.”表示当前目录，此时find将从当前目录开始，逐个在其子目录中查找
满足后面指定条件的文件。（和）表示括号（），其中的“”称为转义符。之所以这样
写是由于对Shell而言，（和）另有不同的含义，而不是这里的用于组合条件的用途。“
- name a.out”是指要查找名为a.out的文件；“- name ‘*.o’”是指要查找所有名字
以 .o结尾的文件。这两个- name之间的- o表示逻辑或（or），即查找名字为a.out或名
字以 .o结尾的文件，find在当前目录及其子目录下找到这佯的文件之后，再进行判断，
看其最后访问时间是否在7天以前（条件－atime +7），若是，则对该文件执行命令rm（
- exec rm{ };）。其中{ }代表当前查到的符合条件的文件名，；则是语法所要求的。
上述命令中第一行的最后一个是续行符。当命令太长而在一行写不下时，可输入一个，
之后系统将显示一个>，指示用户继续输入命令。
　　locate命令
　　locate命令用于查找文件，它比find命令的搜索速度快，它需要一个数据库，这个
数据库由每天的例行工作（crontab）程序来建立。当我们建立好这个数据库后，就可以
方便地来搜寻所需文件了。
　　该命令的一般形式为：
　　locate 相关字
　　例如：查找相关字issue
　　$ locate issue
　　/etc/issue
　　/etc/issue.net
　　/usr/man/man5/issue.5
　　/usr/man/man5/issue.net.5
　　第十课(三)　文本处理命令　　　　　　　　　　　　　　
　　Sort命令
　　sort命令的功能是对文件中的各行进行排序。sort命令有许多非常实用的选项，这
些选项最初是用来对数据库格式的文件内容进行各种排序操作的。实际上，sort命令可
以被认为是一个非常强大的数据管理工具，用来管理内容类似数据库记录的文件。
　　Sort命令将逐行对文件中的内容进行排序，如果两行的首字符相同，该命令将继续
比较这两行的下一字符，如果还相同，将继续进行比较。
　　语法：
　　sort ［选项］文件
　　说明：sort命令对指定文件中所有的行进行排序，并将结果显示在标准输出上。如
不指定输入文件或使用“- ”，则表示排序内容来自标准输入。
　　sort排序是根据从输入行抽取的一个或多个关键字进行比较来完成的。排序关键字
定义了用来排序的最小的字符序列。缺省情况下以整行为关键字按ASCII字符顺序进行排
序。
　　改变缺省设置的选项主要有：
　　- m 若给定文件已排好序，合并文件。
　　- c 检查给定文件是否已排好序，如果它们没有都排好序，则打印一个出错信息，
并以状态值1退出。
　　- u 对排序后认为相同的行只留其中一行。
　　- o 输出文件将排序输出写到输出文件中而不是标准输出，如果输出文件是输入文
件之一，sort先将该文件的内容写入一个临时文件，然后再排序和写输出结果。
　　改变缺省排序规则的选项主要有：
　　- d 按字典顺序排序，比较时仅字母、数字、空格和制表符有意义。
　　- f 将小写字母与大写字母同等对待。
　　- I 忽略非打印字符。
　　- M 作为月份比较：“JAN”<“FEB”<? <“DEC”。
　　- r 按逆序输出排序结果。
　　＋posl - pos2 指定一个或几个字段作为排序关键字，字段位置从posl开始，到po
s2为止（包括posl，不包括pos2）。如不指定pos2，则关键字为从posl到行尾。字段和
字符的位置从0开始。
　　- b 在每行中寻找排序关键字时忽略前导的空白（空格和制表符）。
　　- t separator 指定字符separator作为字段分隔符。
　　下面通过几个例子来讲述sort的使用。
　　用sort命令对text文件中各行排序后输出其结果。请注意，在原文件的第二、三行
上的第一个单词完全相同，该命令将从它们的第二个单词vegetables与fruit的首字符处
继续进行比较。
　　$ cat text
　　vegetable soup
　　fresh vegetables
　　fresh fruit
　　lowfat milk
　　$ sort text
　　fresh fruit
　
　　fresh vegetables
　　lowfat milk
　　vegetable soup
　　用户可以保存排序后的文件内容，或把排序后的文件内容输出至打印机。下例中用
户把排序后的文件内容保存到名为result的文件中。
　　$ sort text>result
　　以第2个字段作为排序关键字对文件example的内容进行排序。
　　$ sort +1-2 example
　　对于file1和file2文件内容反向排序，结果放在outfile中，利用第2个字段的第一
个字符作为排序关键字。
　　$ sort -r -o outfile +1.0 -1.1 example
　　sort排序常用于在管道中与其他命令连用，组合完成比较复杂的功能，如利用管道
将当前工作目录中的文件送给sort进行排序，排序关键字是第6个至第8个字段。
　　$ ls - l | sort +5 - 7
　　sort命令也可以对标准输入进行操作。例如，如果您想把几个文件文本行合并，并
对合并后的文本行进行排序，您可以首先用命令cat把多个文件合并，然后用管道操作把
合并后的文本行输入给命令sort，sort命令将输出这些合并及排序后的文本行。在下面
的例子中，文件veglist与文件fruitlist的文本行经过合并与排序后被保存到文件clis
t中。
　　$ cat veglist fruitlist | sort > clist
　　uniq命令
　　文件经过处理后在它的输出文件中可能会出现重复的行。例如，使用cat命令将两个
文件合并后，再使用sort命令进行排序，就可能出现重复行。这时可以使用uniq命令将
这些重复行从输出文件中删除，只留下每条记录的唯一样本。
　　语法：uniq ［选项］文件
　　说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更
多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结
果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从
标准输入读取。
　　该命令各选项含义如下：、
　　- c 显示输出中，在每行行首加上本行在文件中出现的次数。它可取代- u和- d选
项。
　　- d 只显示重复行。
　　- u 只显示文件中不重复的各行。
　　- n 前n个字段与每个字段前的空白一起被忽略。一个字段是一个非空格、非制表符
的字符串，彼此由制表符和空格隔开（字段从0开始编号）。
　　+n 前n个字符被忽略，之前的字符被跳过（字符从0开始编号）。
　　- f n 与- n相同，这里n是字段数。
　　- s n 与＋n相同，这里n是字符数。
　　例如：
　　1. 显示文件example中不重复的行。
　　uniq - u example
　　2. 显示文件example中不重复的行，从第2个字段的第2个字符开始做比较。
　　uniq - u - 1 +1 example

沙漠里的海豚

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Linux循序渐进(7)

第十课(二)文件内容查询命令　　　　　　grep、fgrep和egrep命令　　这组命令以指定模式搜索文件，并通知用户在什么文件中搜索到与指定的模式匹配的字符串，并打印出所有包含该字符串的文本行，在该文本行的最前面是该行所在的文件名。grep命令一次只能搜索一个指定的模式；egrep命令检索扩展的正则表达式（包括表达式组和可选项）；fgrep命令检索固定字符串，它不识别正则表达式，是快速搜索命令。
复制链接

扫一扫