awk处理带有空格的字符串_find、grep、awk、sed 学习

最新推荐文章于 2024-03-22 10:02:33 发布

weixin_39573981

最新推荐文章于 2024-03-22 10:02:33 发布

阅读量742

点赞数

文章标签： awk处理带有空格的字符串 cannot find symbol什么意思 find 排除 grep 同时过滤两种字符 grep 显示包含两个关键字 sed 把文件中某行的字符去掉

学习于：

https://www.bilibili.com/video/av18167558?from=search&seid=17346680780299653867www.bilibili.com

先时find: 也就是找文件。

find /home/ -name "text.txt" : 在home目录下寻找名为text.txt的文件在哪，后面文件名最好加上双引号。

find /home/ -name "*.txt" ：这里有个通配符 * ，意思是那home目录下所有的 .txt 字符串结尾的文件全部显示出来。

find /home/ -name "text.txt" | more : 当显示的内容太多时，可以加上管道符more 进行分页查看，space就是翻页，enter就是下一行。网上说按B可以看上一页的内容，结果我试了不能，不知道为啥。按q就退出

因为显示出来的既会包含文件，也会包含目录，所以要区分，通过-type

find /home/ -name "*.txt" -type d 这个显示出来的都是目录 directory

find /home/ -name "*.txt" -type f 这个显示出来的都是文件 file

find . "*.txt" -type f 这里去掉了绝对路径，用 . 来表示相对路径，也就是当前目录下寻找。

find . "*.txt" -type f -mtime +30 30天之前修改的文件

find . "*.txt" -type f -mtime -1 1天以为修改的文件

find . "*.txt" -type f -mtime -1 |xargs rm -rf {} ; 将find出来的内容替换到rm -rf后的大括号，通过xargs管道符进行连接。后面的 ; 是一种格式。这样的话就把find出来的文件全部删除了。

find . "*.txt" -type f -mtime -1 -exec cp -r {} tmp ; 把find出来的文件拷贝到tmp目录下。这里由于xargs的局限性，所以就不能用来拷贝了，但是可以使用-exec，这个使用范围更广。 cp的-r：若给出的源文件是一个目录文件，此时将复制该目录下所有的子目录和文件。

xargs :只支持rm exec:支持 cp,mv,chmod,chown

find . "*.txt" -type f -mtime -1 -size +1k 这里另外加上文件大小要大于1k的要求。这里先要满足修改时间在一天内，同时满足大小大于1k的才会显示出来。

（这里后面的千字节单位k要小写k，如果是兆的话就要大写M。）

find . "*.txt" -type f -mtime -1 -size +1k -perm 755 加上权限为755的限制

find . -type f -exec chmod -R 644 {} ; 在当前目录下把所有文件的权限改为644

关于文件目录权限的基础知识普及：

删除服务器30天之前的日志：

find . -type f "*.log" -mtime +30 -exec rm -rf {} ;

然后到grep:

本意为过滤查询的意思。其实就是找文件里的内容。

grep "root" /etc/passwd :查询passwd文件里带有root字符串的行

grep --color "root" /etc/passwd :把显示出来的root用颜色标记。

grep -n --color "root" /etc/passwd :再加上行号显示。

grep -n --color "^root" /etc/passwd :找以root开头的行，就是在root前面加个尖括号。

grep -n --color "root$" /etc/passwd ：以root结尾的那一行

grep "#" /usr/local/nginx/conf/nginx.conf.default :只显示带有#号的行，也是是文件里面的注释部分显示出来。

grep -v "#" /usr/local/nginx/conf/nginx.conf.default :把不包含#号的行显示出来。加了个-v

grep -v "#" /usr/local/nginx/conf/nginx.conf.default | grep -v "^$" :把显示出来的空行全部删除，也就是以空开头，以空结尾的行的反义。这样看nginx的配置文件就没有了注释和空行，就很舒服。

-i 是忽略大小写，-n是输出行号，-v是反向选择

grep -E =egrep

下面要匹配一个IP地址：主要是grep匹配正则表达式。

grep --color "[0-9][0-9]" text.txt ：匹配连续的数字，并加颜色显示

grep --color "[0-9}{1}" text.txt ：grep不支持{}重复，所以此命令无效,此时要使用egrep

egrep --color "[0-9]{1}" text.txt : 匹配一个数字。

egrep --color "[0-9]{1，3}." text.txt ：匹配1到3个连续数字，并且加上 " ." ,这里注意加上转义符。如果没有转义符，一个“.”代表任意字符。那么就什么都匹配上去了。

egrep --color "[0-9]{1，3}.[0-9]{1，3}.[0-9]{1，3}.[0-9]{1，3}" text.txt 这样就匹配了IP的4部分了。可是后面如果有多的数字的话也会匹配进来

egrep --color "[0-9]{1，3}.[0-9]{1，3}.[0-9]{1，3}.[0-9]{1，3}$" text.txt 后面加上通配符$，表示以什么结尾，这样就会把后面有多余的排除掉。按理说开头也要加上个^的，不知道为啥他不加。。

egrep --color "([0-9]{1，3}.){3}[0-9]{1，3}$" text.txt 这样加个小括号括起来就可以省略掉很多字符串了。 大括号表示匹配的次数。

然后是看awk：数据统计，日志分析

awk '{print $1}' /etc/passwd | more :把文件的第一列打出来

（这里要理解一列的意思，列是以空格作为分隔，没有空格，即使换行也是一列）

比如： netstat -ant 查看tcp连接

然后

netstat -ant | awk '{print $6}' 即把第六列输出，结果如下：

大家注意列的概念。

再比如说：如下，想把每列的开始的用户名取出来。

这里采取的措施是把用户名后面的冒号去掉，就变成了列分隔了。如下：

awk -F: '{print $1}' /etc/passwd | head -5

-F: 即-F把后面的：去掉了。 head -5 取前5行

awk -F: '{print $1,$NF}' /etc/passwd | head -5

$NF 则是最后一列。即只输出第一列和最后一列。

awk -F: '{print $1":"$NF}' /etc/passwd | head -5

双引号在awk里面是添加的意思，这样就在第一列和最后一列中间加上了冒号。这里可以添加任意字符。

现在进行一个简单的实例：

比如ifconfig得到网卡信息如下：

然后想要把ip地址192.168.1.244输出并且变为 192-169-1-244

第一步：ifconfig | grep "inet"

然后把第一个和第三个去掉

ifconfig | grep "inet"| grep -v "127" |grep -v "0.0.0.0"

然后这里要区分出有几列，很明显，有4列。然后取出第二列。

ifconfig | grep "inet"| grep -v "127" |grep -v "0.0.0.0" | awk '{print $2}'

然后转换格式：

ifconfig | grep "inet"| grep -v "127" |grep -v "0.0.0.0" | awk '{print $2}' | awk -F. '{print $1"-"$2"-"$3"-"$4}'

把前面输出的东西当作主机名：

hostname ` ifconfig | grep "inet"| grep -v "127" |grep -v "0.0.0.0" | awk '{print $2}' | awk -F. '{print $1"-"$2"-"$3"-"$4}' `

注意，这里有个反引号在外面包裹，这个符号在esc下面的地方，我的是和 ~ 在一起的。

也就是 hostname `名称`

然后是sed的学习：

先是初始文件：

然后是我们的操作： sed 's/jackhe/xiaohong/' a.txt

最开始的单引号后面的s表示字符串替换，即把jackhe替换为xiaohong. 这里注意是有3个斜杠，而且它只是把文件的输出进行替换，并不进行文件的修改。

但是上面的指挥把第一个出现的修改，而如果需要修改后面的则需要如下：

sed 's/jackhe/xiaohong/2' a.txt 这是修改第二个。

sed 's/jackhe/xiaohong/g' a.txt g是全部替换

sed 's#jackhe#xiaohong#g' a.txt 把斜杠改为井号也是可以的，这只是一个格式。

sed 's#jackhe#xiao///.hong#g' a.txt 也是可以的，这样#里面的都会变成字符处理。如果不是#号包裹，而是/，那么里面的/就需要进行转义，即 ///了。

sed -i 's#jackhe#xiaohong#g' a.txt 如果要真正的修改文件内容，那么就要加上个-i选项。

如果sed里面有变量，则必须要用双引号了，不能使用单引号。

整体感觉比较简单，目前看只需要让我能看懂大部分的脚本即可。

欢迎交流讨论。

weixin_39573981

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
awk处理带有空格的字符串_find、grep、awk、sed 学习

学习于：https://www.bilibili.com/video/av18167558?from=search&seid=17346680780299653867www.bilibili.com先时find: 也就是找文件。find /home/ -name "text.txt" : 在home目录下寻找名为text.txt的文件在哪，后面文件名最好加上双引号。find /h...
复制链接

扫一扫