大数据Linux基础——05正则表达式与文本分析

1、正则表达式在文本编辑中用处大,其基本规则有:

匹配操作符

\                 转义字符
. 	             匹配任意单个字符
[1249a],[^12],[a-k]  字符序列单字符占位
^                 行首
$                  行尾
\<,\>:\<abc           单词首尾边界
|                   连接操作符
(,)              选择操作符
\n    	     反向引用

重复操作符:

?      匹配0到1次。
*      	匹配0到多次。
+     	匹配1到多次。
{n}   	匹配n次。
{n,}  	匹配n到多次。
{n,m}      匹配n到m次。

与扩展正则表达式的区别:grep basic

?, +, {, |, (, and )

匹配任意字符

.*

2-1、实例操作:

有以下文本例子
在这里插入图片描述
①、找出含有ooxx的行:
grep “ooxx” grep.txt
在这里插入图片描述
②、找出包含数字的行:
grep “[0-9]” grep.txt
在这里插入图片描述
③、找出包含3或者4的行
grep “[34]” grep.txt
在这里插入图片描述
④、找出包好4个数字的行:
grep “[0-9]{4}” grep.txt或者grep -E “[0-9]{4}” grep.txt
在这里插入图片描述
⑤、找出包含ooxx单词的行
grep “<ooxx>” grep.txt
在这里插入图片描述
⑥、只包含4位数字的行
grep “[ ^0-9][0-9]{4}[ ^0-9]” grep.txt
在这里插入图片描述

2-2实例操作

在这里插入图片描述
①、grep “a” test
在这里插入图片描述
②、grep “a{3}” test
在这里插入图片描述
③、grep “<aaa” test,查找以aaa开头的在这里插入图片描述

④、grep “<aaa>” test
在这里插入图片描述
⑤、 grep “b” test
在这里插入图片描述
⑥、grep “b{2,3}” test
在这里插入图片描述
⑦、 grep “god” test
在这里插入图片描述
⑧、 grep “godgood” test
无输出
⑨、grep “god*good” test
无输出
⑩、grep “god.good" test
在这里插入图片描述
⑪、grep "god.good.god.good" test
在这里插入图片描述
⑫、grep "god.good+" test
无输出
⑬、grep "(god.good)+" test
无输出
⑭、grep “(god).good.\1” test
在这里插入图片描述
⑮、grep "(god).
(good).
\1.
\2" test
在这里插入图片描述
⑯、grep "(god).
(good).
\2.
\1” test
在这里插入图片描述

2、文本操作符

cut:显示切割的行数据

f:选择显示的列
s:不显示没有分隔符的行
d:自定义分隔符,下例子中-d自定义分隔符空格
例如:cut -d’ ’ -f1 gerp.txt
在这里插入图片描述
在这里插入图片描述
查看passwd下的第一列用户名数据
在这里插入图片描述
在这里插入图片描述

sort:排序文件的行

n:按数值排序
r:倒序
t:自定义分隔符
k:选择排序列
u:合并相同行
f:忽略大小写

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值