\u00e9 匹配é
也可以使用八进制\351来匹配é
使用ack
ack '\pL' schiller.txt 可以查看属性为L(所有字母)的字符
ack '\p{Ll}' schiller.txt 小写字母高亮
字符属性
C 其他字符
Cc 控制字符
Cf 格式字符
Cn 未分配字符
Co 专用字符
Cs 替代字符
L 字母
Ll 小写字母
Lm 修饰字母
Lo 其他字母
Lt 标题大写字母
Lu 大写字母
L& Ll,Lu或者Lt
M 标记符号
Mc 空格标记
Me 环绕标记
Mn 非空格标记
N 数字
Nd 十进制数字
Nl 字母数字
No 其他数字
P 标点符号
Pc 连接标点符
Pd 破折号
Pe 结束标点符
Pf 最终标点符
Pi 起始标点符
Po 其他标点符
Ps 开始标点符
S 符号
Sc 货币符号
Sk 修饰符号
Sm 数学符号
So 其他符号
Z 分隔符
Zl 行分符号
Zp 段落分隔符
Zs 空格分隔符
在正则表达式中可以用\cx来制定一个控制符
书中例子 perl -n -e 'print if /\c@/' ascii.txt 可以看到
0. Null 因为空字符不能被显示
还可以用\0 来查找空字符 用\cG 来查找报警字符
总结
\uxxxx Unicode 四位
\xxx Unicode 两位
\x{xxxx} Unicode四位
\x{xx} Unicode 两位
\ooo 八进制
\cx 控制字符
\0 空字符
\a 报警符
\e 转义符
[\b] 退格符