正则表达式学习 5 匹配Unicode字符和其他字符

\u00e9 匹配é 
也可以使用八进制\351来匹配é
 
使用ack
ack '\pL' schiller.txt 可以查看属性为L(所有字母)的字符
ack '\p{Ll}' schiller.txt  小写字母高亮
 
字符属性
C     其他字符
Cc   控制字符
Cf    格式字符
Cn   未分配字符
Co   专用字符
Cs   替代字符
L     字母
Ll    小写字母
Lm  修饰字母
Lo   其他字母
Lt    标题大写字母
Lu   大写字母
L&   Ll,Lu或者Lt
M    标记符号
Mc  空格标记
Me  环绕标记
Mn  非空格标记
N     数字
Nd   十进制数字
Nl    字母数字
No   其他数字
P    标点符号
Pc   连接标点符
Pd   破折号
Pe   结束标点符
Pf    最终标点符
Pi    起始标点符
Po   其他标点符
Ps   开始标点符
S    符号
Sc   货币符号
Sk   修饰符号
Sm  数学符号
So   其他符号
Z     分隔符
Zl    行分符号
Zp   段落分隔符
Zs   空格分隔符
 
 
在正则表达式中可以用\cx来制定一个控制符
书中例子 perl -n -e 'print if /\c@/' ascii.txt  可以看到
0. Null 因为空字符不能被显示
 
还可以用\0 来查找空字符 用\cG 来查找报警字符
 
 
总结
\uxxxx  Unicode 四位
\xxx     Unicode  两位
\x{xxxx}   Unicode四位
\x{xx}    Unicode  两位
\ooo    八进制
\cx     控制字符
\0    空字符
\a    报警符
\e    转义符
[\b]    退格符
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值