数据库中级教程:第二讲 正则表达式的应用
所谓正则表达式是一种被设计用来优化字符串操作的语言。它使用一组元字符(Metacharacters)
来实现强劲的字符串操作能力。这组元字符最早来自于对DOS文件系统中?和*的扩展。在DOS文件
系统中,?和*分别被用来代替单个字符和字符群组,它们可以被认为是最早的元字符。正则表达式
在它们的基础上不断扩充,形成了一套元字符集,能够表达非常复杂的字符串。
举例来说,网上注册时常常需要用户输入一个有效的Email地址。当用户输入一个字符串后,
我们如何验证这个Email地址是否合法呢?使用下面这个正则表达式可以轻易地实现目的:
--------------------------------------------------------------------------------
@"^([\w-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)|(([\w-]+\.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(\]?)$"
--------------------------------------------------------------------------------
关于这个正则比表达式的含义,在此不做过多解释,有兴趣的朋友可以参考相关的正则表达式资料。
这个正则表达式虽不能保证用户输入的Email地址100%的真实有效,但至少可以保证用户输入
的Email地址看上去是合法有效的。
在javascript编程语言中的正则匹配
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]
匹配空行的正则表达式:\n[\s| ]*\r
匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
匹配首尾空格的正则表达式:(^\s*)|(\s*$)(像vbscript那样的trim函数)
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?
以下是例子:
利用正则表达式限制网页表单里的文本框输入内容:
用正则表达式限制只能输入中文:οnkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"
1.用正则表达式限制只能输入全角字符: οnkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"
2.用正则表达式限制只能输入数字:οnkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
3.用正则表达式限制只能输入数字和英文:οnkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
下面说一下Oracle数据库对正则表达式的支持。它的实现遵循IEEE的(POSIX)
标准和unicode的规范。
\ 根据上下文有四种意思,表示它自己,引用下一个字符,介绍一个操作符,空操作。
* 匹配0到多个目标子符串
+ 匹配1到多个目标子符串
?匹配0到1个目标子符串
| 匹配多个中的一个
^ 匹配前缀
$ 匹配后缀
{m} 匹配仅m次
{m,} 匹配至少m次
{m,n} 匹配从m到n次
在oracle中对正则表达式的扩展有
\d 匹配一个数字
\D 匹配一个非数字
\w 匹配一个字母字符
\W 匹配一个非字母类字符
\s 匹配一个空格字符
\S 匹配一个非空格字符
\A 仅匹配一个字符串的开头
\Z 仅匹配一个字符串的结尾