以下为总结,其实可直接跳过,查看locate部分,这个是类似windows下verything搜索工具!
一.Linux查找文件的相关命令
常 用 命 令 | 简要中文说明 | 程序所在目录 |
whereis | 寻找文件工具 | /usr/bin |
find | 寻找文件工具 | /usr/bin |
locate | 寻找文件工具 | /usr/bin |
grep | 寻找某字串内容工具 | /bin |
env | 查看环境设置 | /usr/bin |
whereis 文件名
寻找文件工具
whereis 是一个小巧好用的文件寻找工具,它专门用来寻找可执行的程序、原始程序和使用手册。
whereis命令只能用于程序名的搜索,而且只搜索二进制文件(参数-b)、man说明文件(参数-m)和源代码文件(参数-s)。如果省略参数,则返回所有信息。
例如执行命令:
whereis bzip2
它就会告诉您,bzip2 放在 /usr/bin 。通常,如果您确定某个东西是程序,而用 whereis 找不到的话,那就表示本系统没有安装该程序了,例如:
whereis cjoe
表示这套系统中没有装 cjoe,否则应该会找到才对。
find [寻找的目录] [表示式]
寻找文件工具
find 是高级的寻找文件工具,可不像 whereis 那么“阳春白雪”。但也因为它太高级了,复杂到很多人用不熟练。我们尽量只举简单的例子。
最简单的格式如下:
find / -name my* -print
这个意思是请它从最底层的主目录开始找,找出文件名是 my 开头的文件,把它显示出来。-print 选项是显示,您可把它当做固定要加上的项目。
但它还可以用时间来找,例如:
find /usr -atime 3 –print
会从 /usr 目录开始往下找,找最近3天之内存取过的文件。
find /usr -ctime 5 –print
会从 /usr 目录开始往下找,找最近5天之内修改过的文件。
find /doc -user jacky -name 'j*' –print
会从 /doc 目录开始往下找,找jacky 的、文件名开头是 j的文件。
find /doc /( -name 'ja*' -o- -name 'ma*' /) –print
会从 /doc 目录开始往下找,找寻文件名是 ja 开头或者 ma开头的文件。
find /doc -name '*bak' -exec rm {} /;
会从 /doc 目录开始往下找,找到凡是文件名结尾为 bak的文件,把它删除掉。-exec 选项是执行的意思,rm 是删除命令,{ } 表示文件名,“/;”是规定的命令结尾。
locate 文件名
寻找文件工具
locate 也是一个寻找文件的工具,但是它不像 whereis 只能找程序文件等几种文件,也不像find那么复杂,可以算是“中庸之道”!
locate命令其实是“find -name”的另一种写法,但是要比后者快得多,原因在于它不搜索具体目录,而是搜索一个数据库(/var/lib/locatedb),这个数据库中含有本地所有文件信息。Linux系统自动创建这个数据库,并且每天自动更新一次,所以使用locate命令查不到最新变动过的文件。为了避免这种情况,可以在使用locate之前,先使用sudo updatedb命令,手动更新数据库。
中庸之道,往往就是大部分人最佳的选择,如图2-32所示。
图2-32 3种寻找文件命令的对比 |
它默认没有扫描外接的移动硬盘或者挂载在/media下的其他分区. 以/etc/updatedb.conf文件为例, 内容如下:
-------------------------------------------------------------------------
PRUNE_BIND_MOUNTS="yes"
# PRUNENAMES=".git .bzr .hg .svn"
PRUNEPATHS="/tmp /var/spool /media"
PRUNEFS="NFS nfs nfs4 rpc_pipefs afs binfmt_misc proc smbfs autofs iso9660 ncpfs coda devpts ftpfs
devfs mfs shfs sysfs cifs lustre_lite tmpfs usbfs udf"
-------------------------------------------------------------------------
第一行PRUNE_BIND_MOUNTS="yes"的意思是: 是否进行限制搜索.
第二行 # PRUNENAMES=".git .bzr .hg .svn"表示对哪些后缀的文件排除检索, 也就是列在这里面的后缀的
文件跳过不进行检索. 不同后缀之间用空格隔开. 这个功能默认是关闭的(用#注释掉了), 如果需要打开需将
#去掉.
第三行是排除检索的路径, 即列出的路径下的文件和子文件夹均跳过不进行检索. 其中/media目录被屏蔽掉了.
第四行是排除检索的文件系统类型, 即列出的文件系统类型不进行检索.
只需要将第三行中的/meida删除即可. 修改为PRUNEPATHS="/tmp /var/spool ", 重新运行updatedb,
再进行locate即可以对原来挂载在/media下的windows ntfs分区进行搜索.
grep [-选项] [字串] [文件名]
寻找某字串内容工具
有些时候,我们存储文件时随手乱取了一个文件名,事后自己都忘了那个文件名叫什么,连开头第一个字母都想不起来。那么,如果您还记得该文件一点特殊的词语,应该可以用 grep 命令找到。
例如,我们想在一个目录的200个文件里面,找出哪一个文件提到“排版”这个词语:
grep 排版 *.txt
找到了两个文件有此字样。然后您再自行调出看看到底哪一篇才是您所要的即可。寻找时注意尽量寻找特殊词语,如果您输入“然后”、“这样”、“不是”、“电脑”……这类太普遍的词语,可能几百篇文章中都有,那就失去了用 grep 找文件的意义了。
因为例子中第二篇文章出现了两次,所以列出了3行,其实只有两个文件符合。如果您想要让它凡是符合条件的只出现一次的话,加上 -l 选项就可以了,如图2-33所示。
图2-33 增加-l选项后的grep命令 |
其他常用的选项还有:
-n 同时列出该词语出现在文章的第几行。
-c 计算一下该字串出现的次数。
-i 比对的时候,不计较大小写的不同
env
查看环境设置
env 命令可以设置很多环境变量,例如终端机的类型、使用的浏览器、用户主目录(Home Directory)的所在等等。
但是我们现在把焦点集中在其中一项:PATH环境变量。
因为 PATH 这个环境变量掌管了您下达命令的时候,它会到下面几个目录去找您命令的程序:
/usr/bin
/sbin
/usr/sbin
/usr/X11R6/bin
/root/bin
那么您用 env 命令,让它把所有的环境变量列出来的时候,就可以看到有一行PATH 设置,把上述几个目录用分号分开,然后串成一串。这就是它所谓寻找命令的“路径”。DOS 系统也有一个同名而且意义非常相似的路径设置。如图2-34所示。
图2-34 执行env命令 |
如果您想在它查找命令的路径上增加一个 /usr/bin/he,而把 /root/bin 去掉,那么您可以重新下达:
env PATH=/usr/bin;/sbin;/usr/sbin;/usr/X11R6/bin;/usr/bin/he
当然env 其他的变量也可以这样改变。但是因为涉及面太广,我们就只把焦点集中在改变查找路径上,其他暂时不谈。
二.linux文本搜索命令
文本的提取和排序
下面介绍几个重要的文本提取工具。
使用grep匹配模式
本章前面简要地介绍了grep命令,用它进行一个串中某些模式的匹配,采用正规表达式。(关于正规表达式的详细介绍,请参阅http://www.regular-expressions.info/tutorial.html处的教程。)词grep是global regular expression print(全局正规表达式打印)的首字母缩写,它是从下面的vi命令衍生出来的,下面的命令打印与正规表达式re相匹配的所有行。
可将正规表达式 想象为用来定位文件中文本的搜索标准。因此,grep类似于别的操作系统中的搜索命令。grep搜索文件(或多个文件)的每一行,寻找给定串的第一次出 现,如果找到这个串,打印出相应的行。例如,输出文件test.txt中包含表达式oracle database的所有行,可以按如下的方式使用grep命令:
为了输出test.txt文件中不包含表达式oracle database的所有行,可使用带-v选项的grep命令,如下所示:
除-v选项外,grep命令还可以使用如下的几个选项。
q -c:打印每个输入文件匹配行计数。
q -l:打印每个输入文件的名字。
q -n:提供每个输出行的行号。
q -i:忽略表达式中字母的大小写。
除grep外,还可以使用fgrep(固定grep)搜索文件。fgrep命令不使用正规表达式。此命令直接进行串比较,查找某个固定串而不是一个正规表达式的匹配。
grep的egrep版本帮助处理复杂的正规表达式,比正规的grep命令快。
剪切、粘贴和联结文本
通常,需要剪切一个文件文本的某部分,或者联结来自不止一个文件的文本。UNIX提供了执行这些任务的命令,以下各节对它们进行介绍。
1.用cut命令输出列
cut命令输出一个文本文件的指定的列。假如有一个名为example.txt的文件,它具有如下的文本:
可用-f选项指定要提取的字段。下面的命令将返回example.txt文件中的第二列:
使用带-c选项的cut命令来指定希望从一个文件中提取的特定字符。下面的两个命令分别提取password.txt文件中的第10个字符以及第10-12个字符:
可与-f选项一 起使用-d选项提取直到一个特定定界符的所有字符。下面的例子说明,cut命令提取passwd文件的第一个字段(f1),用-d选项指出该字段是由冒号 (:)定界的。(passwd文件位于/etc目录,此目录保存UNIX和Linux系统用户账号信息。)
2.用paste命令联结文件
paste命令从一个源取一行并把它与来自另一源的另一行组合起来。假如有两个文件:test1.txt包含字符串one two three,test2.txt包含one four five six。可如下用paste命令将两个文件结合:
3.用join命令联结文件
join命令也结合两个文件的内容,但它只在两个文件有一个共同字段时进行结合。前一节中,test1.txt和test2.txt不具有共同的列,因此对这两个文件使用join命令不起作用。但如果有两个文件test.one和test.two,它们的内容如下:
默认情况下,join命令只匹配第一个字段,所以它将根据共同的(第一列)给出如下的结果:
-1选项允许指出使用哪个字段作为第一个文件中的匹配字段。-2选项允许指定使用哪个字段作为第二个文件中的匹配字段。例如,如果第一个文件的第二个字段匹配第二个文件的第三个字段,可使用如下的join命令:
可使用-o选项以后面的格式指定输出字段:file.filed。因此,要打印匹配行的第一个文件的第二个字段和第二个文件的第三个字段,可使用如下带选项的join命令:
4.用sort命令排序文本
可用sort命令对文本文件的行进行排序,不管这些行是来自于管道或来自于文件。如果使用-m选项,sort只合并文件而不排序。假如有一个名为test.txt的文件,其内容如下:
可用sort命令将test.txt文件的内容按字母顺序输出:
默认时,sort在文本的第一列上进行排序。
5.用uniq命令删除重复的行
uniq命令删除文件的重复行。在一个管道中,此命令通常后跟一个sort命令。使用-c选项,可将其用来对某行进行计数,或者使用-d选项,可用来只报告重复的行。
上面的例子中,sort命令使用-m选项合并两个文件,test.one和test.two。输出管道到带-c选项的uniq命令。所得出的是一个按字母顺序排列的表,所有重复行被删除。而且还给出每行重复的频率。
三.Linux查找文件内容的常用命令方法
从文件内容查找匹配指定字符串的行: $ grep "被查找的字符串" 文件名
从文件内容查找与正则表达式匹配的行: $ grep –e “正则表达式” 文件名
查找时不区分大小写: $ grep –i "被查找的字符串" 文件名
查找匹配的行数: $ grep -c "被查找的字符串" 文件名
从文件内容查找不匹配指定字符串的行: $ grep –v "被查找的字符串" 文件名
从根目录开始查找所有扩展名为.log的文本文件,并找出包含”ERROR”的行 find / -type f -name "*.log" | xargs grep "ERROR"
如果需要查找的内容包含特殊符号,比如$等等,grep要加参数 find ./ -name "*.php" | xargs grep -F '要查找的内容'
四.定位一个程序文件
Which命令在linux系统中用来定位一个程序文件,包含别名和路径的工具。
使用权限
所有用户
语法格式
which [ 程序名称 ]
使用说明
which 命令取得程序名列表并寻找当这些文件名作为命令给定时所运行的文件。which 命令展开每个参数(如果它有别名),并沿着用户的路径搜索它。别名和路径从用户主目录中的 .cshrc 文件取得。如果 .cshrc 文件不存在,或者如果路径没有在 .cshrc 文件中定义,则 which 命令使用在用户环境中定义的路径。如果名称的别名多于一个单字或如果在路径里没有找到一个有参数名称的可执行文件,那么将会给出诊断信息。
使用实例
要查找与 lookup 命令名有关的可执行文件:which lookup