正则表达式

正则表达式的定义是以字符为基本单位的。

字符可分为元字符和普通字符。

元字符:是在正则表达式中表示特殊含义的字符。

普通字符:指除元字符外的所有Unicode字符。

说明:Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

元字符包括:

“.”:用于匹配任何单字符(除换行符外)。

“\”:用于字符转义。

“^”:用于匹配输入字符串的开始。

“$”:用于匹配输入字符串的结束。

“|”:可用来创建多个正则表达式分支。

“?”:作为量词出现,用来匹配0个或1个字符。

“*”:作为量词出现,用来匹配0个或多个字符。

“+”:作为量词出现,用来匹配1个或多个字符。

“{}”:和为量词出现,用来匹配指定个数的字符。

例:A{3}:表示匹配3个字符“A”。

A{3,}:表示匹配3个或更多字符“A”。

A{3,5}:表示匹配3个到5个字符“A”。

“[]”:定义了某个范围内的字符。

例:[az]:用于匹配字符“a”或“z”。

[a-z]:用于匹配字符“a”到“z”的任意字符。

[a-z0-9]:用于匹配字符“a”到“z”或字符“0”到“9”中的任意字符。

[^a-z]:表示除了“a”和“z”之外的所有Unicode字符。

注:这里的“^”表示该范围之外的字符集合,必须出现在“[]”之内。

常用的反义代码:

\b:代表单词的开头或结尾,也就是单词的分界处;

\s:匹配任意的空白符(包括空格、制表符、换行符、中文全角空格等);

\s+:匹配不包含空白符的字符串;

\w:匹配字母、数字、下划线等;

\d:匹配一位数字(0~9);

[^x]:匹配除了x以外的任意字符

[^aeiou]:匹配除了aeiou这几个字母以外的任意字符;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值