前端 js 经典:字符编码详解

前言:计算机只能识别二进制,开发语言中数据类型还有数字,字母,中文,特殊符号等,都需要转化成二进制编码才能让技术机识别。

一. 编码方式

ACSLL、Unicode、utf-8、URL 编码、base64 等。

1. ACSLL

对英语字符与二进制位之间的关系,做了统一规定。这被称为 ASCII 码。标准 ACSLL 有 128 个字符(2^7)。分为 33 个不可见字符,95 个可见字符。这 128 个符号,只占用了一个字节的后面 7 位,最前面的一位统一规定为`0`。后面扩展为 EASCLL 有 256 个字符(2^8)

33 个不可见字符:用于进行终端的换行、响铃、删除等动作,在这不做缀叙。

95 个可见字符:48-57 代表 0-9 数字,65-90 代表大写字母 A-Z,97-122 代表小写字母 a-z,剩下的 32-126 代表 ! " # 等字符。

2. Unicode

Unicode 将世界上所有的符号都纳入其中,这是一种所有符号的编码。统一码(Unicode)规定了每个字符的数字编号,这个编号被称为码点(code point)。码点以 U+hex 的形式表示,U+是代表 Unicode 的前缀,而 hex 是一个 16 进制数。取值范围是从 U+0000 到 U+10FFFF。

Unicode 通常为两个字节,对于英文字符的一个字节即可表示,高位字节补 0,这样对比 ASCII 编码存储空间就会翻倍,在存储和传输上就十分不划算。这就会使得 Unicode 编码一时间很难推广。于是,为了较好的解决 Unicode 的编码问题, UTF-8 和 UTF-16、UTF-32 应运而生(UTF-8 是 8 位的单字节码元,UTF-16 是 16 位的双字节码元,UTF-32 是 32 位的四字节码元)。UTF 是 Unicode TransferFormat 的缩写。

3. utf-8

UTF-8 是 Unicode 使用最广的实现方式之一,UTF-8 最大的一个特点,就是它是一种变长的编码方式。它可以使用 1~4 个字节表示一个符号,根据不同的符号而变化字节长度

4. URL 编码

因为 URL 只能包含标准的 ASCII 字符,所以必须对其他特殊字符进行编码。

JavaScript 提供了四个 URL 的编码/解码方法,可以用于将非 ASCII 码的字符,如中文字符、特殊字符、表情字符等,进行 UTF-8 的编解码操作:

编码:encodeURI() 和 encodeURIComponent()

解码:decodeURI() 和 decodeURIComponent()

encodeURI 与 encodeURIComponent 区别:encodeURI 通常用于转码整个 URL,不会对 URL 元字符以及语义字符进行转码。encodeURIComponent 通常只用于转码 URL 组成部分,如 URL 中?后的一串;会转码除了语义字符之外的所有字符,即元字符也会被转码

5. base64

在图片比较多的情况为了减少 http 请求,图片地址会用 base64 编码。格式:data:图片类型 ; 编码类型, data 字符串数据

例子:<img width="900" height="450" src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAGMAAAAqCAYAAA...."/>

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yqcoder

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值