JavaScript(ES6标准)处理占多个字节的汉字

最新推荐文章于 2023-07-03 17:12:03 发布

yuban12315

最新推荐文章于 2023-07-03 17:12:03 发布

阅读量1k

点赞数 1

分类专栏：学习记录文章标签： JavaScript Unicode

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuban12315/article/details/88180892

版权

写这篇文章的动机是看到了这篇博客：CVTE前端开发在线笔试-2017.9.14

其中一个题目是写一个截取子串的函数subStr(str,len),如果串中有汉字，则汉字长度按2计算。假设str为‘我ABC汗DEF’，当len为4时应输出‘我AB’，当len为6时输出‘我ABC’

我们都知道JS支持Unicode编码，答案中判断中文的方式是，遍历字符串，用str[i]获取字符，用正则表达式（如下）检验字符。

 /[^\u4E00-\u9FA5]/

这个正则的含义是匹配不在这个范围内的中文字符，如果是汉字，返回false，如果不是汉字，返回true。

因为Unicode编码中 4E00-9FA5 表示的是20902个基本汉字,所以一般情况下，上面的方法是不会出错的，能够正确识别到字符串中的汉字。

当然特殊情况下就会出现问题了。

我来引出今天的主角 ‘?’，首先我们得确定的是，它是一个汉字。点这里可以看对它的解释。

'?’的Unicode编码是 \u20BB7，这意味着，上面的正则表达式并不能检测出这个汉字：

const re =  /[^\u4E00-\u9FA5]/
console.log(re.test(&

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
JavaScript(ES6标准)处理占多个字节的汉字

写这篇文章的动机是看到了这篇博客：CVTE前端开发在线笔试-2017.9.14其中一个题目是写一个截取子串的函数subStr(str,len),如果串中有汉字，则汉字长度按2计算。假设str为‘我ABC汗DEF’，当len为4时应输出‘我AB’，当len为6时输出‘我ABC’我们都知道JS支持Unicode编码，答案中判断中文的方式是，遍历字符串，用str[i]获取字符，用正则表达式（如下）检...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。