-- Start
作为一名程序员,大家都应该知道什么是编码吧。呵呵,其实, 所谓的编码就是字符和数字之间的映射, 我们把这个数字称为代码点或码位。在正则表达式中,我们可以直接使用这个代码点,问题是如何知道一个字符的代码点呢? 呵呵, 很简单,用下面的 Java 代码,我们就可以很容易的知道字符 u 的八进制代码点是 165。
System.out.println(Integer.toOctalString('u'));
现在,我们有了字符 u 的八进制代码点,我们来看如何在正则表达式中使用它。#!/usr/bin/perl my $testText = "I love regular expressions."; if($testText =~ m/reg\165lar/) { print "finds the word."; } else { print "cannot find the word."; }
public static void main(String[] args) { String testText = "I love regular expressions."; String regExp = "reg\165lar"; Pattern p = Pattern.compile(regExp); Matcher m = p.matcher(testText); if (m.find()) { System.out.println("finds the word."); } else { System.out.println("cannot find the word."); } }
呵呵,是不是很简单啊,值得注意的是八进制转义只支持从\000到\377。如果你想使用更大范围的代码点,就应该使用十六进制转义,我将在下一节为大家介绍十六进制转义。
--更多参见:正则表达式精萃
-- 声 明:转载请注明出处
-- Last Updated on 2012-05-07
-- Written by ShangBo on 2012-05-07
-- End