正则表达式与文本处理器

一.正则表达式概述
1.正则表达式定义
·正则表达式,又称正规表达式,常规表达式
·使用字符串来描述,匹配一系列符合某个规则的字符串
·正则表达式组成
①.普通字符
1)大小写字母,数字,标点符号及一些其他符号
②.元字符
2)在正则表达式中具有特殊意义的专用字符
2.正则表达式层次
·基础正则表达式
·扩展正则表达式
3.Linux中文本处理工具
·grep
·egrep
·sed
·awk

二.基础正则表达式元字符
1.基础正则表达式是常用的正则表达式部分
2.除了普通字符外,常见到以下元字符
①:转义字符,!,\n等
②^:匹配字符串开始的位置
③$:匹配字符串结束的位置
④.:匹配除\n之外的任意的一个字符
⑤*:匹配前面子表达式0次或者多次
⑥[list]:匹配list列表中的一个字符
⑦[^list]:匹配人已不在list列表中的一个字符
⑧{n,m}:匹配前面子表达式n次到m次,有{n},{n,},{n,m}三种格式

三.扩展正则表达式
①+:重复一个或者一个以上的前一个字符
②?:零个或者一个的前一个字符
③|:使用或者(or)的方式找出多个字符
④():查找“组”字符串
⑤()+:辨别多个重复的组

四.sed工具概述
1.文本处理工具,读取文本内容,根据指定的条件进行出理,如删除,替换,添加等
2.可在无交互的情况下实现相当复杂的文本处理操作
3.被广泛应用于shell脚本,以完成自动化处理任务
4.sed依赖于正则表达式
5.工作原理
读取→执行→显示

五…sed命令格式
1.sed命令格式
sed -e ‘编辑指令’ 文件1 文件2…
sed -n -e ‘编辑指令’ 文件1 文件2…
sed -i -e ‘编辑指令’ 文件1 文件2…
2.常用选项
·-e:指定要执行的命令,只有一个编辑命令时可省略
·-n:只输出处理后的行,读入时不显示
·-i:直接编辑文件,而不输出结果
·-f:用指定的脚本文件来处理输入的文本文件

3.编辑命令格式
[地址1[地址2]] 操作 [参数]
·地址:可数组,正则表达式,$,没有地址代表是所有行
·操作:可以是a,c,d,p,s,r,w,i,s,y等
·参数,一般有g,代表只要符合条件的全部进行处理

六.sed用法示例
1.输出示例
2.删除示例
3.替换示例
4.迁移示例
5.使用脚本编辑文件
6.sed直接操作文件示例

七.awk工具介绍
1.功能强大的编辑工具
2.无交互的情况下实现复杂的文本操作
3.命令格式
awk选项‘模式或条件{编辑指令}’文件1 文件2
awk -f 脚本文件 文件1 文件2

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值