Linux下shell中的文本处理正则表达式

1.grep 文本过滤命令

Global search regular expressing and print out the line

全面搜索研究正则表达式并显示出来
grep命令是一种强大的文本搜索工具,根据用户指定的”模式“对目标文本进行匹配检查,打印匹配到的行
由正则表达式或者字符及基本文本字符所编写的过滤条件

grep的格式
grep 匹配条件 处理文件
e.g.

grep root passwd				/过滤出passwd中含有root的行
grep ^root passwd 				/过滤出passwd中以root开头的行
grep root$ passwd 				/过滤出passwd中以root结尾的行
grep -i root passwd	   			/忽略大小写过滤出passwd中含有“root”的行
grep -E "root|ROOT" passwd			/过滤出passwd中含有root或ROOT的行
grep -Ei "^root|root$" passwd -v | grep root	/过滤出passwd中除了以root开头和结尾的行
grep ROOT passwd -n2 				/过滤出passwd中ROOT行以及它的上下两行
grep ROOT passwd -A1 				/过滤出passwd中ROOT行以及它的下一行
grep ROOT passwd -B1				/过滤出passwd中ROOT行以及它的上一行

【11】

grep中字符的匹配位置设定

^关键字
关键字$
\<关键字
关键字\>
\<关键字\>

grep中的字符的匹配次数设定

*			/字符出现[0-任意次]
\>			/字符出现[0-1次]
\+			/字符出现[1-任意次]
\{n\}			/字符出现[n次]
\{m,n\} 		/字符出现[最少m次,最多n次]
\{0,n\}			/字符出现[0-n次]
\{m,\}			/字符出现[至少m次]
\(xy\)\{n\}xy		/关键字出现[n次]
.*			/关键字之间匹配任意字符

grep中的正则表达式

^westos
westos^
'w....s'
'w.....'
'.....s'

grep正则表达式与扩展正则表达式
正规的grep不支持扩展的正则表达式,竖线是用于表示“或”的扩展正则表达式元字符,正规的grep无法识别
加上反斜杠,这个字符就像被翻译成扩展正则表达式,就像grep和grep -E一样

grep xy westos        	      /过滤查看westos文件中的xy
grep x*y westos               /x个数任意后跟y
grep x.y westos     	      /xy中间跟任意一个字符
grep -E  x?y westos 	      /y前紧跟0-1个x
grep -E  x+y westos   	      /y前紧跟x个数是1到任意个,匹配到所有的对
grep -E  x{1}y westos	      /y前有一个x即可,匹配所有
grep -E  "\<x{1}y" westos     /y前有一个x,且在行首
grep -E  "x{1}y\>" westos     /y前有一个x,且在行末
grep -E  "\<x{2}y\>" westos   /y前有二个x,且一行只有xy
grep -E  "x{1,}y" westos      /y前的x个数1到任意,匹配所有
grep -E  "(xy){1,}" westos    /xy个数1到任意

【15】【16】

2.sed 行编辑器

stream editor

用来操作纯ASCII码文本
处理时,把当前处理的行李存储在临时缓冲区中,称为”模式空间“(pattern space)可以指定仅仅处理哪些行
sed 符合模式条件的处理,不符合条件的不予处理
处理完成之后把缓冲区的内容送往屏幕
接着处理下一行,这样不断重复,直到文件末尾

sed用法
p模式
显示

sed -n '/\:/p' fstab     /屏蔽掉模式空间内容,显示fstab文件中有符号:的行
sed -n '/UUID$/p' fstab  /屏蔽掉模式空间内容,显示UUID结尾的行
sed -n '/^UUID/p' fstab  /屏蔽掉模式空间内容,显示UUID开头的行
sed -n '2p;6p' fstab     /屏蔽掉模式空间内容,显示第2行和6行
sed -n '2,6p' fstab      /屏蔽掉模式空间内容,显示2-6行
sed -n '2,6!p' fstab     /屏蔽掉模式空间内容,2-6行不显示

【17】
模式空间中存在文件所有内容

-n       只显示,屏蔽模式空间内的数据
不加-n    多显示,将选择的内容显示一次,再将文件内容显示一次,相当于选择内容显示两次

:ifconfig eth0 | sed -n '/inet\>/p' /查看ifconfig eth0 显示inet行的内容
例:显示行数

cat -b fstab > westos
sed 5p westos

【18】

d模式
删除
/不能屏蔽内存空间,即使用-n

sed '/^UUID/d' fstab   /不显示UUID开头的行
sed '/^#/d' fstab      /不显示以#开头的行
sed '/^$/d' fstab      /不显示空行,删掉空行
sed '1,4d' fstab       /不显示1-4行
sed '/^UUID/!d' fstab  /不显示以UUID的行  

【19】【20】

a模式
下边添加

sed '/^UUID/a \hello sed' fstab  /在以UUID开头的行下一行添加hello sed内容
sed '/^UUID/a \hello sed\nwestos' fstab  /在以UUID开头的行下一行添加hello sed内容,并换行添加westos

【21】

i模式
上边插入

sed '/^UUID/i \hello sed\nwestos' fstab  /在以UUID开头的行上一行添加hello sed内容,并换行添加westos

【22】

c模式
替换

sed '/^#/c\hello westos' fstab   /在文件fstab中将以#开头的行的内容全部换成hello westos

【23】

w模式
写到文件里

sed '/^UUID/w /mnt/yy.txt' /etc/fstab     /在文件/etc/fstab中将以UUID开头的行的内容全部写入到文件yy.txt,yy.txt可以原不存在,直接写入
sed -n '/^UUID/w /mnt/yy.txt' /etc/fstab  /在文件/etc/fstab中将以UUID开头的行的内容全部写入到文件yy.txt,加-n在写入时不显示模式空间内容
sed '/^UUID/=' fstab        /在以UUID开头的行添加行号
sed '6r /etc/issue' /etc/fstab  /将/etc/issue写入到/etc/fstab第六行   
sed '/^#/=' fstab > file1   /给fstab文件中以#开头的行加行号导入到法file1文件(必须存在),不改变fstab文件内容
sed '/^#/=' fstab -i file1  /给fstab文件中以#开头的行加行号,并把他导入到法file1文件
/加行号不能使用/w写入文件
-i 可更改本身内容
> 不更改本身内容,但有清空本身内容的功能

整合文件

sed  '/^[0-9]/d' -i fstab  /将0-9开头的行屏蔽掉整合到文件fstab,文件中不存在有行号的行

例:

sed '/^#/=' fstab > fstab  /fstab内容被清空
sed '/^$/d;/^#/=' fstab    /屏蔽空行,并显示行号

例:

sed -n '/^[0-9]/p'  fstab  /若不需要则整合
sed  '/^[0-9]/d' -i fstab

sed的其他用法

sed -n '/^UUID/=' fstab   /屏蔽掉模式空间,显示以UUID开头行的行号
sed -n -e '/^UUID/p' -e '/^UUID/=' fstab  /-e表示直接在命令列模式上进行sed动作的

编辑;表示同时的意思

sed -e 's/See/westos/g;s/by/lee/g' fstab   /直接在命令列模式上进行替换
sed -f rule fstab   /-f后边跟sed脚本文件名,表示对于fstab执行rule规则 
sed 's/^\//#/g'  /etc/fstab   /将/etc/fstab全文以/做为开头的/替换为#
sed 's@^/@#@g' /etc/fstab     /将/etc/fstab全文以/做为开头的/替换为#
sed 's/\//#/g' /etc/fstab     /将/etc/fstab全文的/替换为#
sed '1,4s/#//g' /etc/fstab    /将/etc/fstab中1-4行的#全部替换成空

例:sed -f rule fstab的用法

  vim rule
       /^UUID/d
       /^#/cwestos
 sed -f rule fstab

【24】

sed 'G'   passwd      /显示passwd文件每一行后边加一个空行
sed '$!G' passwd      /显示每一行后边加一个空行,最后一行不加
sed '='   passwd      /显示每一行的前一行加上此行行号
sed '='   passwd | sed 'N;s/\n //g'   /sed逐行加载,加N;则加载此行时同时下一行,s表示全文\n表示换行符
显示最后一行,与tail -n 1意思相同

3.awk 报告生成器

awk处理机制:awk会逐行处理文本,支持在处理第一行之前做一些准备工作,以及在处理完最后一行做一些总结性的工作,在命令模式上分别体现如下:
BEGIN{}:读入第一行文本之前执行,一般用来初始化操作
{}:逐行处理,逐行读入文本执行相应的处理,是最常见的编辑指令块
END{}:处理完最后一行文本之后执行,一般用来输出处理结果
awk基本用法
linux上面默认使用gawk

awk '{print FILENAME}' passwd        /每处理文件passwd中一行内容就打印一次文件名
awk -F : '{print NF}' passwd         /以 : 做为分隔符,抓取文件中每行内容的列数
awk -F : '{print NR}' passwd         /以 : 做为分隔符,抓取passwd文件每行的行号
awk -F : '{print NF,NR}' passwd	     /以 : 做为分隔符抓取passwd文件行数和列数
awk 'BEGIN{print NAME}'              /以 : 做为分隔符,开头打印字符NAME
awk 'END{print END}'                 /结尾打印字符END
awk -F : 'BEGIN{print NAME}{print $1}END{print END}' passwd  #在passwd文件以 : 做为分隔符,开头输出NAME,输出第一列内容,末尾输出END
awk '/bash$/' passwd                 /抓取以bash结尾的一行
awk -F : '/bash$/{print $1}'passwd   /抓取以bash结尾的一行并输出第一列
cat -b passwd       #查看passwd文件内容并标明行

例:抓取eth0网卡的ip

ifconfig eth0 | awk '/inet\>/ {print $2}'

【25】
例:统计在系统中可以登陆系统的用户并且家目录不在/home

awk -F : 'BEGIN{n=0}/bash$/&&$6!~/^\/home/ {print;n++}END{printf n}‘ passwd
$6~/bin 第六列等于bin
\< 防止前面有字符
>/ 防止后面有字符

【26】

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。在编写C程序时,需要注意变量的声明和定义、指针的使用、内存的分配与释放等问题。C语言常用的数据结构包括: 1. 数组:一种存储同类型数据的结构,可以进行索引访问和修改。 2. 链表:一种存储不同类型数据的结构,每个节点包含数据和指向下一个节点的指针。 3. 栈:一种后进先出(LIFO)的数据结构,可以通过压入(push)和弹出(pop)操作进行数据的存储和取出。 4. 队列:一种先进先出(FIFO)的数据结构,可以通过入队(enqueue)和出队(dequeue)操作进行数据的存储和取出。 5. 树:一种存储具有父子关系的数据结构,可以通过序遍历、前序遍历和后序遍历等方式进行数据的访问和修改。 6. 图:一种存储具有节点和边关系的数据结构,可以通过广度优先搜索、深度优先搜索等方式进行数据的访问和修改。 这些数据结构在C语言都有相应的实现方式,可以应用于各种不同的场景。C语言的各种数据结构都有其优缺点,下面列举一些常见的数据结构的优缺点: 数组: 优点:访问和修改元素的速度非常快,适用于需要频繁读取和修改数据的场合。 缺点:数组的长度是固定的,不适合存储大小不固定的动态数据,另外数组在内存是连续分配的,当数组较大时可能会导致内存碎片化。 链表: 优点:可以方便地插入和删除元素,适用于需要频繁插入和删除数据的场合。 缺点:访问和修改元素的速度相对较慢,因为需要遍历链表找到指定的节点。 栈: 优点:后进先出(LIFO)的特性使得栈在处理递归和括号匹配等问题时非常方便。 缺点:栈的空间有限,当数据量较大时可能会导致栈溢出。 队列: 优点:先进先出(FIFO)的特性使得
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值