HTML 字符集

HTML 字符集
HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集!

然而并非一直如此。早期 Web 的字符编码为 ASCII。

后来,从 HTML 2.0 到 HTML 4.01,ISO-8859-1 被视为标准字符集。

有了 XML 和 HTML5,UTF-8 终于出现并解决了许多字符编码问题。

最初:ASCII
计算机数据以二进制代码(01000101)存储在电子设备中。

为了使文本的存储标准化,创建了美国信息交换标准码(American Standard Code for Information Interchange,ASCII)。它为每个可存储字符定义了一个唯一的二进制数字,以支持 0-9 之间的数字、大写和小写字母(a-z,A-Z)以及特殊字符(比如 ! $ + - ( ) @ < > ,)。

由于 ASCII 使用 7 位字符,因此它只能表示 128 个不同的字符。

ASCII 的最大缺点是,它排除了非英文字母。

如今,ASCII 仍在使用,特别是在大型主机计算机系统中。

在 Windows 中:Windows-1252
Windows-1252 是 Windows(直到 Windows 95)中的默认字符集。

它是 ASCII 的扩展,增加了国际字符。

它使用一个完整的字节(8 位)表示 256 个不同的字符。

由于 Windows-1252 是 Windows 中的默认设置,因此所有浏览器都支持它。

在 HTML 4 中:ISO-8859-1
HTML 4 中最常用的字符集是 ISO-8859-1。

ISO-8859-1 是 ASCII 的扩展,增加了国际字符。

实例
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
在 HTML 4 中,可以在 <meta> 标签中指定与 ISO-8859-1 不同的字符集:

实例
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
所有 HTML 4 处理器也都支持 UTF-8:

实例
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
提示:当浏览器检测到 ISO-8859-1 时,它通常默认为 Windows-1252,因为 Windows-1252 还有 32 个国际字符。

如需更深入的研究,请访问我们的 完整的 ISO-8859-1 参考。

在 HTML5 中:Unicode UTF-8
HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集。

实例
<meta charset="UTF-8">
可以在 <meta> 标签中指定不同于 UTF-8 的字符集:

实例
<meta charset="ISO-8859-1">
Unicode 联盟开发了 UTF-8 和 UTF-16 标准,因为 ISO-8859 字符集是受限制的,并且不兼容多语言环境。

Unicode 标准(几乎)涵盖世界上所有的字符、标点和符号。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值