GBase 8c V3.0.0数据类型——POSIX正则表达式

描述:正则表达式是一个字符序列,它是定义一个串集合(一个正则集)的缩写。如果一个串属于正则表达式描述的正则集时,则称该串匹配该正则表达式。POSIX正则表达式提供了比LIKE和SIMILAR TO操作符更强大的含义。表1列出了所有可用于POSIX正则表达式模式匹配的操作符。

表 1 正则表达式匹配操作符

操作符

描述

例子

~

匹配正则表达式,大小写敏感

'thomas' ~ '.*thomas.*'

~*

匹配正则表达式,大小写不敏感

'thomas' ~* '.*Thomas.*'

!~

不匹配正则表达式,大小写敏感

'thomas' !~ '.*Thomas.*'

!~*

不匹配正则表达式,大小写不敏感

'thomas' !~* '.*vadim.*'

匹配规则:

a. 与LIKE不同,正则表达式允许匹配串里的任何位置,除非该正则表达式显式地挂接在串的开头或者结尾。

b. 除了上文提到的元字符外,POSIX正则表达式还支持下列模式匹配元字符,如表2所示。

表 2 元字符及其含义

元字符

含义

^

表示串开头的匹配

$

表示串末尾的匹配

.

匹配任意单个字符

正则表达式函数:

POSIX正则表达式支持下面函数。

n substring(string from pa...函数提供了抽取一个匹配POSIX正则表达式模式的子串的方法。

n regexp_count(string tex...函数提供了获取匹配POSIX正则表达式模式的子串数量的功能。

n regexp_instr(string tex...函数提供了获取匹配POSIX正则表达式模式子串位置的功能。

n regexp_substr(string te...函数提供了抽取一个匹配POSIX正则表达式模式的子串的方法。

n regexp_replace(string, p...函数提供了将匹配POSIX正则表达式模式的子串替换为新文本的功能。

n regexp_matches(string te...函数返回一个文本数组,该数组由匹配一个POSIX正则表达式模式得到的所有被捕获子串构成。

n regexp_split_to_table(st...函数把一个POSIX正则表达式模式当作一个定界符来分离一个串。

n regexp_split_to_array(st...和regexp_split_to_table类似,是一个正则表达式分离函数,不过它的结果以一个text数组的形式返回

正则表达式分离函数会忽略零长度的匹配,这种匹配发生在串的开头或结尾或者正好发生在前一个匹配之后。这和正则表达式匹配的严格定义是相悖的,后者由regexp_matches实现,但是通常前者是实际中最常用的行为。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值