mysql 过滤微信昵称表情符号_js 过滤微信昵称的表情符号

最新推荐文章于 2021-07-16 12:05:13 发布

不正经的知乎小号

最新推荐文章于 2021-07-16 12:05:13 发布

阅读量306

点赞数

文章标签： mysql 过滤微信昵称表情符号

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33489687/article/details/113662032

版权

我先说一下我的解决方法:

// 示例名称:

var str = "阿bc?d的fg?hm天l";

// 将名称拆分为数组,注意: 这样会将表情拆分为两项,其值为代理对.

// 并且因为,代理对无法被浏览器识别,所以它们的值可能会被转化为 U+feff

var strArr = str.split(""),

result = "",

totalLen = 0;

for(var idx = 0; idx < strArr.length; idx ++) {

// 超出长度,退出程序

if(totalLen >= 16) break;

var val = strArr[idx];

// 英文,增加长度1

if(/[a-zA-Z]/.test(val)) {

totalLen = 1 + (+totalLen);

result += val;

}

// 中文,增加长度2

else if(/[\u4e00-\u9fa5]/.test(val)) {

totalLen = 2 + (+totalLen);

result += val;

}

// 遇到代理字符,将其转换为 "口", 不增加长度

else if(/[\ud800-\udfff]/.test(val)) {

// 代理对长度为2,

if(/[\ud800-\udfff]/.test(strArr[idx + 1])) {

// 跳过下一个

idx ++;

}

// 将代理对替换为 "口"

result += "口";

}

};

再说一下我的思路:

1) 首先我知道,这些表情其实也是一种文字,它可以看做某个UTF-16 的码点.可以参见这个附录:

2) 这些表情的码点在UTF-16中是有自己的范围的.而JS中可以通过正则表达式来检测一个文字的码点值

.从而判断它的类型,同理也可以用来判断它是不是中文/英文等.在这个问题里,只需要判断其是否为中

文/英文即可.

3) 为什么是8个中文/16个英文啊?这到底是谁规定的? UTF8 是变长的,中文可能是 2-3个长度,UTF16 里面

中文和英文长度是一样的.所以我很想知道这个规则是干什么的?

PS: 这里的长度是编码单元长度,以 UTF16/UCS2 为例, 一个编码单元16位、2个字节,在UTF16下英文和中文

都是 U+0000 这样的形式,长度相等.除了部分代理对,它们的长度为2,占用32位、两个编码单元外(有无为3的我还

真不知道)。

欢迎大家来讨论.

不正经的知乎小号

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
mysql 过滤微信昵称表情符号_js 过滤微信昵称的表情符号

我先说一下我的解决方法:// 示例名称:var str = "阿bc?d的fg?hm天l";// 将名称拆分为数组,注意: 这样会将表情拆分为两项,其值为代理对.// 并且因为,代理对无法被浏览器识别,所以它们的值可能会被转化为 U+feffvar strArr = str.split(""),result = "",totalLen = 0;for(var idx = 0; idx < s...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。