在使用编辑框输入内容时,为了避免用户输入无关信息以及防止SQL注入,我们可以使用QRegExp类正则表达式对编辑框的输入内容进行限制。本篇,作者将分享如何使用QRegExp类的正则表达式。
一、QRegExp简介
QRegExp类是QT中的正则表达式,由表达式、量词和断言组成。
主要有四个作用:有效性检查、查找、替换、字符串分割,具体如下。
(1)有效性检查,检查字符串是否满足一定要求。
(2)查找,提供了比QString类更强大的匹配模型。
(3)替换,对字符串内符合或不符合要求的字符串进行替换。
(4)字符串分割
二、元字符及通配模式
1.元字符
元字符是QRegExp中的一类正则表达式,它表示一个或多个常量表达式
元字符 作用 实例
. 匹配任意单个字符 1.2,可能是1后面跟任意字符,再跟2
^ 匹配字符串首 ^12,可以是123,但不能是312
$ 匹配字符串尾 12$,可以是312,当不能是 123
[] 匹配括号内输入的任意字符 [123],可以为1、2 或3
* 匹配任意数量的前导字符 1*2,可以为任意数量个1(甚至没有),后面跟一个2
+ 匹配至少一个前导字符 1+2,必须为一个或多个1, 后跟一个2
? 匹配一个前导字符或为空 1?2,可以为2或者12
————————————————
2.通配模式
QRegExp类支持通配符匹配,通配模式相比于RegExp更为简单
在通配模式下,只有?、*、[]3个字符可以使用,它们的功能发生变化
通过QRegExp::setPatternSyntax(QRegExp::Wildcard)可以将元字符设置为通配模式
通配符 作用 实例
? 匹配任意单个字符 1?2,可以为1,后面跟任意单个字符,再跟2
* 匹配任意一个字符序列 1*2,可以为1,后面跟任意数量的字符,再跟一个2
[] 匹配一个定义的字符集合 [a-z]可以匹配a到z之间任意一个字符; [^a]匹配出小写a以外的字符.
————————————————
三、QRegExp构造和方法
1.默认构造函数
产生一个空的正则表达式对象,函数声明如下。
QRegExp();
2.模式构造函数
产生指定匹配模式的正则表达式对象,函数声明如下。
QRegExp(constQString &pattern, Qt::CaseSensitivity cs = Qt::CaseSensitive, PatternSyntaxsyntax = RegExp)
3.isValid() 函数
判断正则表达式是否合法,合法返回true,否则返回false。
QRegExpexp1("[a-z]");
boolvalid=exp1.isValid(); //返回true
QRegExpexp1("[a-z");
boolvalid=exp1.isValid(); //返回false
4.caseSensitivity() 函数
判断正则表达式是否大小写敏感。
Qt::CaseSensitivitycaseSensitivity() const;
5.cap() 和capturedTexts() 函数
前者获得捕捉的每一项,index从1开始,后者则获得整个捕捉列表。
QStringpattern() const;
QStringListcapturedTexts() const;
6.indexIn() 函数
进行匹配,如果成功则返回index,不成功返回-1。
indexIn(constQString &str, int offset = 0, CaretMode caretMode = CaretAtZero) const;
7.exactMatch() 函数,
是否整串匹配,返回true或false。
exactMatch(constQString &str) const;
7.matchedLength() 函数
返回匹配的串的长度。
intmatchedLength() const;
8.pattern() 函数
获得正则表达式本身。
QStringpattern() const;
9.构造和方法实例
QRegExp类部分方法使用实例如下:
QRegExpexpression; //定义QRegExp
expression.setPatternSyntax(QRegExp::RegExp); //设置为RegExp模式
expression.setCaseSensitivity(Qt::CaseSensitive); //设置大小写敏感
expression.setPattern(QString("^[A-Za-z0-9]+$")); //匹配所有大小写字母和数字组成的字符串
QString s ="kojad@0123"; //定义字符串
expression.exactMatch(s); //返回的值为false,因为s中含有@字符
————————————————
四、常用正则表达式实例
以下列出了一些正则表达式含义、常用写法,以及具体实例。
1.常用正则表达式及实例1
\r, \n 代表回车和换行符
\t 制表符
\\ 代表 "\" 本身
\^ 匹配 ^ 符号本身
\$ 匹配 $ 符号本身
. 匹配除了换行符以外的任意字符
\w 匹配字母、数字、下划线、汉字
\s 匹配任意的空白符
\b 单词的开始或结尾
\~ 匹配字符串的开始
$ 匹配字符串的结束
[] 包含一系列字符
[^] 包含之外一系列字符
例1:"\ba\w*\b",匹配以字母a开头的单词,先是开始(\b),然后是字母a,然后是任意数量的字母或数字(\w*),最后是结束(\b).
例2:"\d+",匹配1个或更多连续的数字。+匹配重复1次或更多次.
例3:"\b\w{6}\b", 匹配刚好6个字符的单词.
例4:"[ab5@]":匹配 "a" 或 "b" 或"5" 或 "@".
例5:"[^abc]": 包含abc之外的任意字符.
例6:"[f-k]":f-k之间的任意字符.
2.常用正则表达式及实例2
{n} 表达式重复n次,比如:"\w{2}" 相当于"\w\w";"a{5}" 相当于"aaaaa".
{m,n} 表达式至少重复m次,最多重复n次,比如:"ba{1,3}"可以匹配 "ba"或"baa"或"baaa".
{m,} 表达式至少重复m次,比如:"\w\d{2,}"可以匹配"a12","_456","M12344".
? 表达式0次或者1次,相当于 {0,1},比如:"a[cd]?"可以匹配"a","ac","ad"
+ 表达式至少出现1次,相当于 {1,},比如:"a+b"可以匹配"ab","aab","aaab".
* 表达式不出现或出现任意次,相当于 {0,},比如:"\^*b"可以匹配"b","^^^b".
例1:"\w{2}"相当于"\w\w";"a{5}" 相当于"aaaaa".
例2:"ba{1,3}"可以匹配"ba"或"baa"或"baaa".
例3:"\w\d{2,}"可以匹配"a12","_456","M12344".
例4:"a[cd]?"可以匹配"a","ac","ad".
例5:"a+b"可以匹配"ab","aab","aaab".
例6:"\^*b"可以匹配"b","^^^b".
例7:"[ab5@]"可以匹配 "a" 或 "b" 或"5" 或 "@".
例8:"[f-k]"可以匹配 "f"~"k" 之间的任意一个字母.
例9:"[^abc]"可以匹配 "a","b","c" 之外的任意一个字符.
例10:"[^A-F0-3]"可以匹配"A"~"F","0"~"3" 之外的任意一个字符.