QT正则表达式

暴躁的野生猿

已于 2024-04-23 17:27:21 修改

阅读量4.6k

点赞数 1

分类专栏： QT C/C++ 文章标签： qt 正则表达式开发语言

于 2018-04-09 10:58:09 首次发布

博主新建的qq群：1025127672，欢迎入群讨论

本文链接：https://blog.csdn.net/qq_31073871/article/details/79861831

版权

QT 同时被 2 个专栏收录

77 篇文章 169 订阅

订阅专栏

C/C++

27 篇文章 19 订阅

订阅专栏

函数用法

常用的通配符

函数用法

QT提供的正则类有2个：QRegularExpression 和 QRegExp。两者的用法与API基本一致，但是QRegularExpression 功能更强。

1、indexIn函数：原型为

int QRegExp::indexIn(const QString &str, int offset = 0, CaretMode caretMode = CaretAtZero) const

形参：str为被操作的字符串，从str的第offset个字符的位置开始查找（若offset为负数，指从str的倒数第|offset|个字符开始查找），caremode指示^符号是否要匹配搜索的起始位置。

返回：首次匹配成功的位置索引，若没有匹配成功，返回-1

举例:

QRegExp rx("[0-9]{1,7}");
int pos = rx. indexIn("asd43516QWE92");

被操作的字符串中有两处能够匹配成功，43516和92，返回首次匹配成功的位置，也即数字4所在的位置索引：3
如果想把所有匹配成功的位置都列出来，可以使用循环，原理如下：

 while ((pos = rx.indexIn(str, pos)) != -1) {
      pos += rx.matchedLength();
  }

该循环的作用是：从str的0位置开始查找，找到数字435，然后从pos=0+3+5的位置继续查找，也即在QWE92中继续查找，这样就能找到数字92的位置索引：11

PS 1：

indexIn函数执行完毕后，除了能够返回匹配的位置外，还同时生成了多个有用的结果，这些结果可以通过QRegExp的成员函数来读取，matchedLength()、capturedTexts() 、 pos()、cap()等等，下面挨个介绍这个函数。

PS 2：

如果想快速返回子字符串str_c在母字符串str_m或字符串list中的位置，可以使用QString::indexOf(),或者QStringList::filter()

2、pos函数，原型为：

int QRegExp::pos(int nth = 0) const

该函数是indexIn()、lastIndexIn()、exactMatch()函数的结果函数之一，其返回值为：pos(0)为查到的整个正则段的位置索引，pos(1)、pos(2)、pos(3)```依次为各个捕获段的位置索引。（正则段中的每一个括号都是一个捕获段，除非带有?:前缀，只匹配不捕获）

下面是帮助文档中的一个例子：

QRegExp rx("/([a-z]+)/([a-z]+)");
QString str = "Output /dev/null";
rx.indexIn(str);   // returns 7 (position of /dev/null)
rx.pos(0);       // 返回7，也即整个正则段/([a-z]+)/([a-z]+)在str中匹配的位置,
rx.pos(1);       // 返回8，也即第1个捕获段([a-z]+)在str中的匹配的位置，也即单词dev的位置
rx.pos(2);       // 返回12，也即第2个捕获段([a-z]+)在str中的匹配的位置，也即单词null的位置
rx.pos(3);       // 返回-1，第3个捕获段不存在

3、cap函数，原型为：

QString QRegExp::cap(int nth = 0) const

该函数是indexIn()、lastIndexIn()、exactMatch()函数的结果函数之一，其返回值为：cap(0)为查到的整个正则段的内容，cap(1)、cap(2)、cap(3)```依次为各个捕获段的内容，这个函数与pos函数是一一对应的，pos返回位置，cap返回内容。

下面是帮助文档中的一个例子：

 QRegExp rxlen("(\\d+)(?:\\s*)(cm|inch)");//小括号内带?:前缀，指只匹配不捕获，等价于"(\\d+)\\s*(cm|inch)"

  int pos = rxlen.indexIn("Length: 189cm");
  if (pos > -1)
 {
	QString value = rxlen.cap(0); //返回整个正则段匹配的内容"189cm"
	QString value = rxlen.cap(1); //返回第1个捕获段匹配的内容"189"
	QString unit = rxlen.cap(2); //返回第2个捕获段匹配的内容"cm" // ... }

4、capturedTexts() 函数，原型为

QStringList QRegExp::capturedTexts() const

该函数是indexIn()、lastIndexIn()、exactMatch()函数的结果函数之一，功能与cap函数类似，cap返回匹配的内容需要用形参指定，而该函数capturedTexts返回匹配的内容是通过字符串表QStringList，该list包含了整个正则段的内容、各个捕获段的内容。

帮助文档的一个例子如下：

QRegExp rx("(\\d+)(?:\\s*)(cm|inch(?:es)?)");
  int pos = rx.indexIn("Length: 36 inches");
  QStringList list = rx.capturedTexts();
  // list变量的内容变为 ("36 inches", "36", "inches")

如果想提取list的子项，可以使用QStringList的成员函数at(n)、value(n)、[n]，这三个成员函数各有特色，at(n)是只读的，速度最快，但是必须保证形参n的合法性，否则程序可能崩溃；value(n)速度次之，只读，它会自动检测形参n的合法性，n如果脱离了有效范围，该函数会返回默认值(字符串表的默认值为空串)；重载运算符函数[n]是可读写的，形参n必须保证合法性，否则程序可能崩溃。

5、matchedLength()函数，原型为

int QRegExp::matchedLength() const

该函数是indexIn()、lastIndexIn()、exactMatch()函数的结果函数之一，返回值为最后一次调用indexIn()、lastIndexIn()、exactMatch()后，整个正则段匹配的字符串的长度

6、 lastIndexIn()函数，

功能与indexIn函数类似，只是该函数是倒着查找匹配，而indexIn是正着查找匹配，注意：倒着查找速度很慢，一般不用除非必要。

7、exactMatch函数，

bool QRegExp::exactMatch(const QString &str) const

功能类似于C语言库的strcmp字符串对比函数，只有完全相同才返回true，否则返回false，同时在结果函数matchedLength()可以读取共有多少个字符连续相同

例如：

QRegExp rx2("blue");
    bool ret = rx2.exactMatch("blue");
    qDebug()<<ret << " " <<rx2.matchedLength();
    ret = rx2.exactMatch("bluetooth");
    qDebug()<<ret << " " <<rx2.matchedLength();
    ret = rx2.exactMatch("bluABC");
    qDebug()<<ret << " " <<rx2.matchedLength();
    ret = rx2.exactMatch("red_blue");
    qDebug()<<ret << " " <<rx2.matchedLength();

输出为：

true 4

false 4

false 3

false 0

常用的通配符

\s是指空白，包括空格、换行、tab缩进等所有的空白，而\S刚好相反

这样一正一反下来，就表示所有的字符，完全的，一字不漏的。

另外，[]这个符号，表示在它里面包含的单个字符不限顺序的出现，比如下面的正则：

[ace]*

这表示，只要出现a/c/e这三个任意的字母，都会被匹配

[\s]表示，只要出现空白就匹配

[\S]表示，非空白就匹配

那么它们的组合，表示所有的都匹配，与它相对应的，有[\w\W]等，意义完全相同、

另外要说的一点是，为什么有"."这个通配符了，还要这样的用法。

其实，[\s\S] [\w\W]这样的用法，比较".“所匹配的还要多，因为”."是不会匹配换行的，所有出现有换行匹配的时候，人们就习惯使用[\s\S]或者[\w\W]这样的完全通配模式

暴躁的野生猿

关注

1
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
QT正则表达式

1、indexIn函数：原型为int QRegExp::indexIn(const QString &amp;str, int offset = 0, CaretMode caretMode = CaretAtZero) const形参：str为被操作的字符串，从str的第offset个字符的位置开始查找（若offset为负数，指从str的倒数第|offset|个字符开始查找），caremode指...
复制链接

扫一扫