前言
在做项目的过程中,使用正则表达式来匹配一段文本中的特定种类字符,是比较常用的一种方式,下面是对常用的正则匹配做了一个归纳整理。
正则表达式
正则思路:
先想清楚规则。然后就查一下怎么写这个规则,re — 正则表达式操作,接着拆分文字对应正则语法。最后组合正则语法。
例如,问题:连续的字母加一个数字–>连续组合,不是数字+一个数字–>(\D+\d)
部分匹配
匹配中文:[\u4e00-\u9fa5]
英文字母:[a-zA-Z]
数字:[0-9]
匹配中文,英文字母和数字及_:^[\u4e00-\u9fa5_a-zA-Z0-9]+$
同时判断输入长度:[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}
^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$
需求 | 正则表达式 | 解析 | 注意事项 |
---|---|---|---|
一个正则表达式,只含有汉字、数字、字母、下划线不能以下划线开头和结尾 | ^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$ | ^ 与字符串开始的地方匹配 (?!_) 不能以_开头(?!.*?_$) 不能以_结尾[a-zA-Z0-9_\u4e00-\u9fa5]+ 至少一个汉字、数字、字母、下划线$ 与字符串结束的地方匹配 | 放在程序里前面加@,否则需要\进行转义@"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$" (或者:@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " ) |
只含有汉字、数字、字母、下划线,下划线位置不限 | ^[a-zA-Z0-9_\u4e00-\u9fa5]+$ | / | / |
由数字、26个英文字母或者下划线组成的字符串 | ^\w+$ | / | / |
2~4个汉字 | @"^[\u4E00-\u9FA5]{2,4}$" | / | / |
最长不得超过7个汉字,或14个字节(数字,字母和下划线) | ^[\u4e00-\u9fa5]{1,7}$|^[\dA-Za-z_]{1,14}$ | / | / |
正则表达封装函数
public bool RegexName(string str)
{
bool flag=Regex.IsMatch(str,@"^[a-zA-Z0-9_\u4e00-\u9fa5]+$");
return flag;
}
Regex reg=new Regex("^[a-zA-Z_0-9]+$");
if(reg.IsMatch(s))
{
\\符合规则
}
else
{
\\存在非法字符
}
常用正则表达式大全
(例如:匹配中文、匹配html)
需求 | 正则表达式 | 解析 | 备注 |
---|---|---|---|
匹配中文字符 | [u4e00-u9fa5] | / | 匹配中文还真是个头疼的事,有了这个表达式就好办了 |
匹配双字节字符(包括汉字在内) | [^x00-xff] | / | 可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) |
匹配空白行 | ns*r | / | 可以用来删除空白行 |
匹配HTML标记 | <(S*?)[^>]*>.*?|<.*? /> | / | 网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力 |
匹配首尾空白字符 | ^s*|s*$ | / | 可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式 |
匹配Email地址 | ^[a-zA-Z0-9][\w\.-]*[a-zA-Z0-9]@[a-zA-Z0-9][\w\.-]*[a-zA-Z0-9]\.[a-zA-Z][a-zA-Z\.]*[a-zA-Z]$ | / | 表单验证时很实用 |
身份证 | (^\d{15}$)|(^\d{17}([0-9]|X|x)$) | / | / |
匹配网址URL | [a-zA-z]+://[^s]* | 网上流传的版本功能很有限,上面这个基本可以满足需求 | |
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线) | ^[a-zA-Z][a-zA-Z0-9_]{4,15}$ | / | 表单验证时很实用 |
匹配特定数字 | |||
匹配国内电话号码 | d{3}-d{8}|d{4}-d{7} | / | 匹配形式如 0511-4405222 或 021-87888822 |
匹配腾讯QQ号 | [1-9][0-9]{4,} | / | 腾讯QQ号从10000开始 |
匹配中国邮政编码 | [1-9]d{5}(?!d) | / | 中国邮政编码为6位数字 |
匹配身份证 | d{15}|d{18} | / | 中国的身份证为15位或18位 |
匹配ip地址 | d+.d+.d+.d+ | / | 提取ip地址时有用 |
匹配正整数 | ^[1-9]d*$ | / | / |
匹配负整数 | ^-[1-9]d*$ | / | / |
匹配整数 | ^-?[1-9]d*$ | / | / |
匹配非负整数(正整数 + 0) | ^[1-9]d*|0$ | / | / |
匹配非正整数(负整数 + 0) | ^-[1-9]d*|0$ | / | / |
匹配正浮点数 | ^[1-9]d*.d*|0.d*[1-9]d*$ | / | / |
匹配负浮点数 | ^-([1-9]d*.d*|0.d*[1-9]d*)$ | / | / |
匹配浮点数 | ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ | / | / |
匹配非负浮点数(正浮点数 + 0) | ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$ | / | / |
匹配非正浮点数(负浮点数 + 0) | ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$ | / | / |
匹配特定字符串 | |||
匹配由26个英文字母组成的字符串 | ^[A-Za-z]+$ | / | / |
匹配由26个英文字母的大写组成的字符串 | ^[A-Z]+$ | / | / |
匹配由26个英文字母的小写组成的字符串 | ^[a-z]+$ | / | / |
匹配由数字和26个英文字母组成的字符串 | ^[A-Za-z0-9]+$ | / | / |
匹配由数字、26个英文字母或者下划线组成的字符串 | ^w+$ | / | / |
在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下 | |||
只能输入数字 | ^[0-9]*$ | / | / |
只能输入n位的数字 | ^d{n}$ | / | / |
只能输入至少n位数字 | ^d{n,}$ | / | / |
只能输入m-n位的数字 | ^d{m,n}$ | / | / |
只能输入零和非零开头的数字 | ^(0|[1-9][0-9]*)$ | / | / |
只能输入有两位小数的正实数 | ^[0-9]+(.[0-9]{2})?$ | / | / |
只能输入有1-3位小数的正实数 | ^[0-9]+(.[0-9]{1,3})?$ | / | / |
只能输入非零的正整数 | ^+?[1-9][0-9]*$ | / | / |
只能输入非零的负整数 | ^-[1-9][0-9]*$ | / | / |
只能输入长度为3的字符 | ^.{3}$ | / | / |
只能输入由26个英文字母组成的字符串 | ^[A-Za-z]+$ | / | / |
只能输入由26个大写英文字母组成的字符串 | ^[A-Z]+$ | / | / |
只能输入由26个小写英文字母组成的字符串 | ^[a-z]+$ | / | / |
只能输入由数字和26个英文字母组成的字符串 | ^[A-Za-z0-9]+$ | / | / |
只能输入由数字、26个英文字母或者下划线组成的字符串 | ^w+$ | / | / |
验证用户密码 | ^[a-zA-Z]w{5,17}$ | / | 以字母开头,长度在6-18之间,只能包含字符、数字和下划线 |
验证是否含有^%&’,;=?$"等字符 | [^%&',;=?$x22]+ | / | / |
只能输入汉字 | ^[u4e00-u9fa5],{0,}$ | / | / |
验证Email地址 | ^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$ | / | / |
验证InternetURL | ^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$ | / | / |
验证身份证号(15位或18位数字) | ^d{15}|d{}18$ | / | / |
验证一年的12个月 | ^(0?[1-9]|1[0-2])$ | / | 正确格式为:“01”-“09”和“1”“12” |
验证一个月的31天 | ^((0?[1-9])|((1|2)[0-9])|30|31)$ | / | 正确格式为:“01”“09”和“1”“31” |
匹配中文字符的正则表达式 | [u4e00-u9fa5] | / | / |
匹配双字节字符(包括汉字在内) | [^x00-xff] | / | / |
匹配空行的正则表达式 | n[s| ]*r | / | / |
匹配HTML标记的正则表达式 | /<(.*)>.*|<(.*) />/ | / | / |
匹配首尾空格的正则表达式 | (^s*)|(s*$) | / | / |
匹配Email地址的正则表达式 | w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* | / | / |
匹配网址URL | http://([w-]+.)+[w-]+(/[w- ./?%&=]*)? | / | / |