Linux中使用正则表达式


正则表达式(regular expression):是一种指定字符串模式的简洁方式。通常简写为regex或re。最常见的应用就是搜索字符串。



通过一个例子来学习正则表达式。现在有如下的一个data.txt文件:

Harley is smart


Harley


I like Harley


the dog likes the cat


搜索以”Harley“开头的行:grep ‘^Harley’ data 
搜索以”Harley“结尾的行:grep ‘Harley$’ data
搜索整行都是“Harley”的行:grep ‘^Harley$’ data
统计空行数:grep ‘^$’ data | wc -l
查找包含字符串“Har”的行,并且“Har”出现在单词的开头:grep '\<Har' data
查找包含字符串“Har”的行,并且“Har”出现在单词的结尾:grep 'Har\>' data
查找包含字符串“Harley”的行,并且“Harley”为单词:grep '\<Harley\>' data
查找包含字符串”Har“后面跟两个任意字符,再跟一个字母”y“的行:grep 'Har..y' data
查找包含字符串”Har“后面跟A或者a的字符串的行:grep 'H[aA]' data
使用预定义字符类查找包含包含大写字母后跟小写字母的所有行:grep '[[:upper:]][[:lower:]]' data
使用范围查找包含字符串”3-9“字符串中任意一个的所有行:grep '[3-9]' d
查找包含字符串”X“,同时后面不跟有“a”和“o”的所有行:grep ‘X[^ao]’ data
使用范围和预定义字符类查找一行中某一个字符是非字母字符的行:
grep ‘[^A-Za-z]’ data
grep '[^[:alpha:]]' data
理解正则表达式的关键就是记住每个字符类只表示一个单独的字符。
查看区域设置:locate
查看所有可用区域设置:locate -a
查找包含大写字母的“H”后面包含跟0个或者多个小写字母的行:grep 'H[[:lower:]]*' data
/* *号表示匹配前面的字符0次或者多次出现*/
最常用的是.*可以匹配任何字符的0次或者多次出现。
/* +号表示匹配前面的字符1次或者多次出现, ?号表示匹配前面的字符1次或者0次出现*/
{n}正好匹配n次
{n,}至少匹配n次
{,m}最多匹配m次(在一些程序中无法使用)
{n,m}至少匹配n次,最多匹配m次
查找所有包含2个数字或者3个数字的行(使用\<.\>匹配整个数字):grep ‘\<[0-9]{2,3}\>’ data
查找cat dog bird hamster中包含上述任意单词的一行:grep '\<(cat|dog|bird|hamster)\>' data
如果希望查找真是的*,.或者|,可以使用\引用这些字符。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值