正则表达式完整匹配汉字

网上一般说法是[\u4e00-\u9fa5],这是不完整的,过期15年了(Unicode 4.1, 2005)。

基本平面

  • CJK Unified Ideographs(中日韩统一表意文字)区,4E00-9FFC(Unicode 13.0, 2020):
写法风格正则表达式
JS[\u4E00-\u9FFC]
PCRE[\x{4E00}-\x{9FFC}]
…………
  • CJK Unified Ideographs Extension A, 3400-4DBF
  • 可以试试\p,支不支持要看引擎,写法不是很通用,一般也不支持扩展区的汉字:
引擎正则表达式
Perl\p{CJK_Unified_Ideographs}
.NET\p{IsCJKUnifiedIdeographs}
…………

扩展平面

  • CJK Unified Ideographs Extension B/C/D/E/F, 20000-2EBE0
写法风格正则表达式
JS[\u{20000}-\u{2EBE0}]
PCRE[\x{20000}-\x{2EBE0}]
Python3[\U00020000-\U0002EBE0]
…………
  • CJK Unified Ideographs Extension G, 30000-3134A.
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值