重新认识正则表达式(Javascript)的中括号[]

问题的来源
首先说一下引发我对这个正则中的中括号重新认识的问题吧。今天在读同事代码的时候,在做一个获取url最后的文件名时,他大概是这么写的

let name = url.match(/([^/]*).html?/)[1]

首先纠结的点是 [^/]* (后来发现是自己脑子不好使了),我理解成了匹配^或者/任意多次,但是结果name却是正确的,感觉世界崩塌了,怎么会这样?
然后去查菜鸟教程,原来中括号里^是排除的意思,然后觉得自己理解了这个正则的意思: 匹配一个字符串中不以/开头但是以.html结尾的最长的字符串。

但是再一看, 不对啊/([^/]*).html?/ 的前连个/不是已经配对成了一个正则了吗? 这不是语法错误吗? 什么鬼啊?

我的世界观又被颠覆了,难道中括号里的/是作为一个普通字符存吗吗?

然后我又试一试如下这些元字符:
在这里插入图片描述
元字符“.”不能匹配任何字符了,而是只能匹配自身,而且转移与否表现一致;

在这里插入图片描述
元字符“*”不转义也可以单独使用匹配自身;

在这里插入图片描述
其他的一些元字符也表现一样。

到此我终于可以下了一个结论:
任何元字符,只要放在中括号里,就只能代表字符本身,而不再具有其作为元字符的功能

在我验证这个结论的时候,使用了一些极端的例子,然后抛了一个错误:
在这里插入图片描述
原来我的结论是有毛病的,“-”这个字符就比较有意思,它会根据自身前后来判断他的意义,如果“-”前后不是同时有字符,那么它就代表“-”本身,如果“-”前后都有字符,那么前后字符和“-”共同代表一个范围的字符,这个然后有“-”前后的ascii码决定。
上图中报错就是因为“-”前后有字符,但是因为“-”前的a的ascii码大于后面的A所有报错说:Range out of order in character class(字符顺序错误)。

当然上面的结论还有很多漏洞,比如 “^” 不是代表它本身,而是功能发生转变了,如果要在中括号里匹配 “^”, 就必须转义“\^”。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
JavaScript正则表达式和Java正则表达式在语法上有一些差异,但是它们的基本概念和用法是相似的。下面是将JavaScript正则表达式转换为Java正则表达式的一些常见规则: 1. 语法差异: - JavaScript正则表达式使用斜杠(/)作为定界符,而Java正则表达式使用双引号(")作为定界符。 - JavaScript正则表达式的特殊字符需要进行转义,而Java正则表达式的特殊字符不需要转义。 2. 字符类: - JavaScript正则表达式的字符类使用方括号([])表示,而Java正则表达式使用方括号([])或者Unicode转义(\p{...})表示。 - JavaScript正则表达式的字符类可以使用连字符(-)表示范围,而Java正则表达式需要使用Unicode转义(\uXXXX)表示范围。 3. 量词: - JavaScript正则表达式的量词使用花括号({})表示,而Java正则表达式使用花括号({})或者问号(?)表示。 - JavaScript正则表达式的贪婪量词默认是贪婪模式,而Java正则表达式的贪婪量词需要在后面添加问号(?)来表示非贪婪模式。 4. 边界匹配: - JavaScript正则表达式的边界匹配使用插入符号(^)和美元符号($)表示,而Java正则表达式使用\A和\Z表示。 5. 其他差异: - JavaScript正则表达式的捕获组使用圆括号(())表示,而Java正则表达式使用圆括号(())或者方括号([])表示。 - JavaScript正则表达式的反向引用使用反斜杠加数字(\1、\2等)表示,而Java正则表达式使用美元符号加数字($1、$2等)表示。 以上是一些常见的JavaScript正则表达式转换为Java正则表达式的规则。具体转换时,还需要根据具体的正则表达式进行适当的调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值