ES6中Unicode的改动正则和字符串的变动 codePointAt

苟盛

于 2020-02-26 22:33:54 发布

阅读量341

点赞数 1

分类专栏： ES6/ES7 文章标签：正则表达式 js es6

本文链接：https://blog.csdn.net/function_zzc/article/details/104518252

版权

ES6为了应对Unicode扩展导致的码元与码点不一致问题，引入了`codePointAt`方法和正则标志`u`。`codePointAt`允许正确获取字符串中码点的长度，而`u`标志让正则能够按码点匹配，解决了生僻字导致的匹配错误和长度计算不准确的问题。

摘要由CSDN通过智能技术生成

ES6中Unicode的改动

早期，由于储存空间宝贵，Unicode使用16位二进制来储存文字，我们将一个16位的二进制编码叫做一个码元（Code Unit）。
后来由于技术的发展，Unicode对文字编码进行了扩展，将某些文字扩展到了32位（占用两个码元），并且，将某个对应的二进制数字叫做码点（Code Point）。


	//此时就产生了一个问题
	//在这里我写了一个字符串这个字是一个生僻字读ji
	const text = '吉';
	
	//而我在这里用.length的方法来测试字符串的长度
	console.log('字符串长度：', text.length);
	//用正则表达式来检索看看能不能检索到
	console.log('使用正则测试：', /^.$/.text(text));