日文字符匹配

最新推荐文章于 2022-09-05 14:25:00 发布

epee

最新推荐文章于 2022-09-05 14:25:00 发布

阅读量439

点赞数

文章标签：正则表达式 Perl

以前程序用的EUC编码，在页面输入做检查时，使用的都是EUC的字符编码范围。主要是匹配全角カタカナ (?:\xA5[\xA1-\xF6]|\xA1[\xA6\xBC\xB3\xB4]) 和全角空格 (?:\xA1\xA1)。

现在程序改为UTF-8的了，再用上面的方式会很麻烦，需要把输入转成EUC再做。perl的正则表达式支持Unicode的属性，看上去用起来比直接写编码范围要清楚多了。全角カタカナ可以用 \p{Katakana}。而空格可以用 \p{IsSpace}，它包括\n,\t等，如果只是匹配空白可以用 \p{IsZs}。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
日文字符匹配

以前程序用的EUC编码，在页面输入做检查时，使用的都是EUC的字符编码范围。主要是匹配全角カタカナ (?:\xA5[\xA1-\xF6]|\xA1[\xA6\xBC\xB3\xB4]) 和全角空格 (?:\xA1\xA1)。现在程序改为UTF-8的了，再用上面的方式会很麻烦，需要把输入转成EUC再做。perl的正则表达式支持Unicode的属性，看上去用起来比直接写编码范围要清楚多了。全角カ...
复制链接

扫一扫

epee CSDN认证博客专家 CSDN认证企业博客

码龄22年

0: 原创

-: 周排名

211万+: 总排名

8万+: 访问

: 等级

542: 积分

2: 粉丝

5: 获赞

2: 评论

9: 收藏

私信

关注

热门文章

最新评论

lm_sensors
weixin_44421993: 库你急哇？
原来show status也可以用where的
Chengax: 格式还是没看董，问下大佬是 show 数据库名 status where 表名 like “字段名称”；这样的格式么？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。