正则表达式
正则表达式即一个文本匹配字符串的一种模式,Qt中QRegExp类实现使用正则表达式进行模式匹配,且完全支持Unicode,主要应用:字符串验证、搜索、查找替换、分割。
正则表达式中字符及字符集
元素 | 含义 |
---|
c | 匹配字符本身,如a匹配a |
\c | 跟在\后面的字符匹配字符本身,但本表中下面指定的这些字符除外。 |
\a | 匹配ASCII的振铃 |
\f | 匹配ASCII的换页 |
\n | 匹配ASCII的换行 |
\r | 匹配ASCII的回车 |
\t | 匹配ASCII的水平制表符 |
\v | 匹配ASCII的垂直制表符 |
\xhhhh | 匹配Unicode字符对应的十六进制数 |
\0ooo | 匹配八进制的ASCII/Latin1字符 |
. | 匹配任意字符 |
\d | 匹配任意一个数字 |
\D | 匹配一个非数字 |
\s | 匹配一个空白字符,包括“\t”、“\n”、“\v”、“\f”、“\r”及“” |
\S | 匹配一个非空白字符 |
\w | 匹配一个单词字符,包括任意字符数字下划线,即AZ,az,0~9中任意一个 |
\W | 匹配一个非单词字符 |
\n | 第n个反向引用 |
正则表达式中的量词
量词 | 含义 |
---|
E? | 匹配0次或1次等价于E{0,1} |
E+ | 匹配1次或多次,等价于E{1,} |
E* | 匹配0次或多次,等价于E{0,} |
E{n} | 匹配n次 |
E{n,} | 匹配至少n次 |
E{,m} | 匹配至多m次 |
E{n,m} | 匹配至少n次,至多m次 |
正则表达式中的断言
断言 | 含义 |
---|
^ | 标志字符串的开始。若匹配“”则使用“\” |
$ | 标志字符串的结尾。若匹配“$”则使用“\$” |
\b | 一个单词的边界 |
\B | 一个非单词的边界。当\b为false则它为true |
(?=E) | 表达式后紧跟E才匹配 |
(?!E) | 表达式后不跟E才匹配 |
QRegExp同时支持通配符
通配符 | 含义 |
---|
c | 任意一个字符,表字符本身 |
? | 任意一个字符,类似regexp中“.” |
* | 任意0个或多个字符 |
[…] | 在[]中的字符集 |
demo
#include <QCoreApplication>
#include <QDebug>
#include <QRegularExpression>
int main(int argc, char *argv[])
{
QCoreApplication a(argc, argv);
QRegExp reg("ab");
qDebug() << "匹配字符本身:"
<< reg.exactMatch("abc")
<< reg.exactMatch("ab")
<< endl;
QRegExp reg0("(\\d*\\D{2})");
qDebug() << "匹配数字:"
<< reg0.exactMatch("183cm")
<< reg0.exactMatch("183m")
<< reg0.exactMatch("72in");
QRegExp rx("*.txt");
rx.setPatternSyntax(QRegExp::Wildcard);
qDebug() << "通配符匹配:"
<< rx.exactMatch("License.txt")
<< rx.exactMatch("License.txt.bak")
<< endl;
QRegExp reg1;
reg1.setPattern("\\b(hello|Hello)\\b");
qDebug() << "匹配多个单词:"
<< reg1.indexIn("helloEveryone!")
<< reg1.indexIn("Hmm hello everyone!")
<< reg1.indexIn("Hi girls! Hello boys!")
<< endl;
QRegExp regHeight("(\\d+)(?:\\s*)(cm|inch)");
int res = regHeight.indexIn("YaoMing 226 cm");
if(res > -1){
qDebug() << "文本捕获:"
<< "cap(0):" << regHeight.cap(0)
<< "cap(1):" << regHeight.cap(1)
<< "cap(2):" << regHeight.cap(2)
<< endl;
}
QRegExp reg2;
reg2.setPattern("面(?!包)");
QString str = "面没了,吃面包也好,吃面食物也可以。";
qDebug() << str << endl;
str.replace(reg2,"意大利");
qDebug() << str << endl;
QRegularExpression regExp("hello");
qDebug() << "QRegularExpression 匹配字符:"
<< regExp.match("hello world!");
regExp.setPattern("[A-Z]{3,8}");
regExp.setPatternOptions(QRegularExpression::CaseInsensitiveOption);
qDebug() << "大小写不敏感匹配:"
<< regExp.match("hello");
QRegularExpression reDate("^(\\d\\d)/(\\d\\d)/(\\d\\d\\d\\d)$");
QRegularExpressionMatch match0 = reDate.match("01/10/1949");
if( match0.hasMatch() ){
QString strMatch = match0.captured(0);
QString day = match0.captured(1);
QString month = match0.captured(2);
QString year = match0.captured(3);
qDebug() << "捕获文本:"
<< "strMatch:" << strMatch << endl
<< "day:" << day << endl
<< "month:" << month << endl
<< "year:" << year;
}
QString sPattern;
sPattern = "^(Jan|Feb|Mar|Apr|May) \\d\\d \\d\\d\\d\\d$";
QRegularExpression reDate1(sPattern);
QString ss("Apr 01");
QRegularExpressionMatch match2;
match2 = reDate1.match(ss,
0,
QRegularExpression::PartialPreferCompleteMatch
);
bool bHasMatched = match2.hasMatch();
bool bPartial = match2.hasPartialMatch();
qDebug() << bHasMatched << bPartial;
return a.exec();
}