大数据学习第二天

正则表达式

1.定义:正则表达式是描述字符排列和匹配模式的一种语法规则。

​ 正则表达式主要用于字符串的模式分割、匹配、查找及替换。

​ 正则表达式主要为了模糊匹配。

2.匹配操作符
​ \ 转义字符
​ . 匹配任意单个字符
​ [1249a],[^12],[a-k] 字符序列单字符占位
​ ^ 行首
​ $ 行尾
​ \ <,>:<abc 单词首尾边界
​ | 连接操作符
​ (,) 选择操作符
​ \n 反向引用

3.grep:显示匹配行
​ v:反显示
​ e:使用扩展正则表达式

4.文本处理

grep的作用是按行查找字符,输出包含字符的行。

grep用法:

​ grep一般有两种用法,一种是从文件查找,一种是从管道的输入查找,

  1. grep ‘word’ file.txt
  2. cat file.txt|grep ‘word’

​ cut:显示切割的行数据
​ f:选择显示的列
​ s:不显示没有分隔符的行
​ d:自定义分隔符
​ sort:排序文件的行
​ n:按数值排序
​ r:倒序
​ t:自定义分隔符
​ k:选择排序列
​ u:合并相同行
​ f:忽略大小写

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值