对于正则表达式一直不是很擅长,所以有必要记录一下。
正则表达式的基本知识
行定位符(^与$)
行定位符是用来描述字符串的边界。“$”表示行结尾“^”表示行开始如"^de",表示以de开头的字符串 "de$",表示以de结尾的字符串。
单词定界符
我们在查找的一个单词的时候,如an是否在一个字符串”gril and body”中存在,很明显如果匹配的话,an肯定是可以匹配字符串“gril and body”匹配到,怎样才能让其匹配单词,而不是单词的一部分呢?这时候,我们可以是哟个单词定界符b。
banb 去匹配”gril and body”的话,就会提示匹配不到。
当然还有一个大写的B,它的意思,和b正好相反,它匹配的字符串不能使一个完整的单词,而是其他单词或字符串中的一部分。如BanB。
选择字符(|) ,表示或
选择字符表示或的意思。如Aa|aA,表示Aa或者是aA的意思。注意使用”[]”与”|”的区别,在于”[]”只能匹配单个字符,而”|”可以匹配任意长度的字符串。在使用”[]”的时候,往往配合连接字符”-“一起使用,如[a-d],代表a或b或c或d。
排除字符,排除操作
正则表达式提供了”^”来表示排除不符合的字符,^一般放在[]中。如
限定符(?*+{n,m})
限定符主要是用来限定每个字符串出现的次数。
限定字符
含义
?
零次或一次
*
零次或多次
+
一次或多次
{n}
n次
{n,}
至少n次
{n,m}
n到m次
/x表示16进制
/u 表示按unicode(utf-8)匹配(主要针对多字节比如汉字)
/i 表示不区分大小写(如果表达式里面有 a, 那么 A 也是匹配对象)
/s 表示将字符串视为单行来匹配
必须只有中英文和数字
$match = "/^[\x{4e00}-\x{9fa5}A-Za-z0-9]+$/u";
if(!preg_match($match,$title)){
echo "含有中文,英文,数字以外的字符";
}else{
echo "只有中文,英文,数字以外的字符";
}
只需包含中英文和数字
$match = "/[\x{4e00}-\x{9fa5}A-Za-z0-9]/u";
if(!preg_match($match,$title)){
echo "不含有中文,英文,数字字符";
}else{
echo "含有中文,英文,数字字符";
}
1-5 ↩