目录
函数用法
QT提供的正则类有2个:QRegularExpression 和 QRegExp。两者的用法与API基本一致,但是QRegularExpression 功能更强。
1、indexIn函数:原型为
int QRegExp::indexIn(const QString &str, int offset = 0, CaretMode caretMode = CaretAtZero) const
形参:str为被操作的字符串,从str的第offset个字符的位置开始查找(若offset为负数,指从str的倒数第|offset|个字符开始查找),caremode指示^符号是否要匹配搜索的起始位置。
返回:首次匹配成功的位置索引,若没有匹配成功,返回-1
举例:
QRegExp rx("[0-9]{1,7}");
int pos = rx. indexIn("asd43516QWE92");
被操作的字符串中有两处能够匹配成功,43516和92,返回首次匹配成功的位置,也即数字4所在的位置索引:3
如果想把所有匹配成功的位置都列出来,可以使用循环,原理如下:
while ((pos = rx.indexIn(str, pos)) != -1) {
pos += rx.matchedLength();
}
该循环的作用是:从str的0位置开始查找,找到数字435,然后从pos=0+3+5的位置继续查找,也即在QWE92中继续查找,这样就能找到数字92的位置索引:11
PS 1:
indexIn函数执行完毕后,除了能够返回匹配的位置外,还同时生成了多个有用的结果,这些结果可以通过QRegExp的成员函数来读取,matchedLength()、capturedTexts() 、 pos()、cap()等等,下面挨个介绍这个函数。
PS 2:
如果想快速返回子字符串str_c在母字符串str_m或字符串list中的位置,可以使用QString::indexOf(),或者QStringList::filter()
2、pos函数,原型为:
int QRegExp::pos(int nth = 0) const
该函数是indexIn()、lastIndexIn()、exactMatch()函数的结果函数之一,其返回值为:pos(0)为查到的整个正则段的位置索引,pos(1)、pos(2)、pos(3)```依次为各个捕获段的位置索引。(正则段中的每一个括号都是一个捕获段,除非带有?:前缀,只匹配不捕获)
下面是帮助文档中的一个例子:
QRegExp rx("/([a-z]+)/([a-z]+)");
QString str = "Output /dev/null";
rx.indexIn(str); // returns 7 (position of /dev/null)
rx.pos(0); // 返回7,也即整个正则段/([a-z]+)/([a-z]+)在str中匹配的位置,
rx.pos(1); // 返回8,也即第1个捕获段([a-z]+)在str中的匹配的位置,也即单词dev的位置
rx.pos(2); // 返回12,也即第2个捕获段([a-z]+)在str中的匹配的位置,也即单词null的位置
rx.pos(3); // 返回-1,第3个捕获段不存在
3、cap函数,原型为:
QString QRegExp::cap(int nth = 0) const
该函数是indexIn()、lastIndexIn()、exactMatch()函数的结果函数之一,其返回值为:cap(0)为查到的整个正则段的内容,cap(1)、cap(2)、cap(3)```依次为各个捕获段的内容,这个函数与pos函数是一一对应的,pos返回位置,cap返回内容。
下面是帮助文档中的一个例子:
QRegExp rxlen("(\\d+)(?:\\s*)(cm|inch)");//小括号内带?:前缀,指只匹配不捕获,等价于"(\\d+)\\s*(cm|inch)"
int pos = rxlen.indexIn("Length: 189cm");
if (pos > -1)
{
QString value = rxlen.cap(0); //返回整个正则段匹配的内容"189cm"
QString value = rxlen.cap(1); //返回第1个捕获段匹配的内容"189"
QString unit = rxlen.cap(2); //返回第2个捕获段匹配的内容"cm" // ... }
4、capturedTexts() 函数,原型为
QStringList QRegExp::capturedTexts() const
该函数是indexIn()、lastIndexIn()、exactMatch()函数的结果函数之一,功能与cap函数类似,cap返回匹配的内容需要用形参指定,而该函数capturedTexts返回匹配的内容是通过字符串表QStringList,该list包含了整个正则段的内容、各个捕获段的内容。
帮助文档的一个例子如下:
QRegExp rx("(\\d+)(?:\\s*)(cm|inch(?:es)?)");
int pos = rx.indexIn("Length: 36 inches");
QStringList list = rx.capturedTexts();
// list变量的内容变为 ("36 inches", "36", "inches")
如果想提取list的子项,可以使用QStringList的成员函数at(n)、value(n)、[n],这三个成员函数各有特色,at(n)是只读的,速度最快,但是必须保证形参n的合法性,否则程序可能崩溃;value(n)速度次之,只读,它会自动检测形参n的合法性,n如果脱离了有效范围,该函数会返回默认值(字符串表的默认值为空串);重载运算符函数[n]是可读写的,形参n必须保证合法性,否则程序可能崩溃。
5、matchedLength()函数,原型为
int QRegExp::matchedLength() const
该函数是indexIn()、lastIndexIn()、exactMatch()函数的结果函数之一,返回值为最后一次调用indexIn()、lastIndexIn()、exactMatch()后,整个正则段匹配的字符串的长度
6、 lastIndexIn()函数,
功能与indexIn函数类似,只是该函数是倒着查找匹配,而indexIn是正着查找匹配,注意:倒着查找速度很慢,一般不用除非必要。
7、exactMatch函数,
bool QRegExp::exactMatch(const QString &str) const
功能类似于C语言库的strcmp字符串对比函数,只有完全相同才返回true,否则返回false,同时在结果函数matchedLength()可以读取共有多少个字符连续相同
例如:
QRegExp rx2("blue");
bool ret = rx2.exactMatch("blue");
qDebug()<<ret << " " <<rx2.matchedLength();
ret = rx2.exactMatch("bluetooth");
qDebug()<<ret << " " <<rx2.matchedLength();
ret = rx2.exactMatch("bluABC");
qDebug()<<ret << " " <<rx2.matchedLength();
ret = rx2.exactMatch("red_blue");
qDebug()<<ret << " " <<rx2.matchedLength();
输出为:
true 4
false 4
false 3
false 0
常用的通配符
\s是指空白,包括空格、换行、tab缩进等所有的空白,而\S刚好相反
这样一正一反下来,就表示所有的字符,完全的,一字不漏的。
另外,[]这个符号,表示在它里面包含的单个字符不限顺序的出现,比如下面的正则:
[ace]*
这表示,只要出现a/c/e这三个任意的字母,都会被匹配
[\s]表示,只要出现空白就匹配
[\S]表示,非空白就匹配
那么它们的组合,表示所有的都匹配,与它相对应的,有[\w\W]等,意义完全相同、
另外要说的一点是,为什么有"."这个通配符了,还要这样的用法。
其实,[\s\S] [\w\W]这样的用法,比较".“所匹配的还要多,因为”."是不会匹配换行的,所有出现有换行匹配的时候,人们就习惯 使用[\s\S]或者[\w\W]这样的完全通配模式