html网络语言编码,HTML的语言编码有哪些

在HTML里,编码可导致浏览者通过IE时候网页乱码,也可以导致div+css的兼容性Hack,编码非常的重要,一般编码的位置放在HTML网页中的

和中间。今天我们就介绍一下关于编码的知识。

一般这段网页编码放在html网页中的

和中间。

html编码样式

通过改变charset=utf-8中的utf-8就可以改变网页的编码。

一般我们在写CSS文件时候也需要在CSS文件顶部使用@charset "utf-8";来定义此CSS文件编码类型。一般html源代码和css文件编码要统一,如果不统一会导致CSS hack,页面乱码网页页面排版乱等兼容问题。

常用html编码种类

国内常用的流行的有utf-8、gb2312这两种。一般这两种类型就能满足国内网页编码需求。当然程序和数据库中也会用到这两种编码类型来处理网页和存储数据类型。

UTF-8 有一下特性

UCS 字符 U+0000 到 U+007F (ASCII) 被编码为字节 0x00 到 0x7F (ASCII 兼容). 这意味着只包含 7 位 ASCII 字符的文件在 ASCII 和 UTF-8 两种编码方式下是一样的.

所有 >U+007F 的 UCS 字符被编码为一个多个字节的串, 每个字节都有标记位集. 因此, ASCII 字节 (0x00-0x7F) 不可能作为任何其他字符的一部分.

表示非 ASCII 字符的多字节串的第一个字节总是在 0xC0 到 0xFD 的范围里, 并指出这个字符包含多少个字节. 多字节串的其余字节都在 0x80 到 0xBF 范围里. 这使得重新同步非常容易, 并使编码无国界, 且很少受丢失字节的影响.

可以编入所有可能的 231个 UCS 代码

UTF-8 编码字符理论上可以最多到 6 个字节长, 然而 16 位 BMP 字符最多只用到 3 字节长.

Bigendian UCS-4 字节串的排列顺序是预定的.

字节 0xFE 和 0xFF 在 UTF-8 编码中从未用到.

GB2312 有以下特性

GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄罗斯语西里尔字母在内的682个全形字符。

GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖99.75%的使用频率。GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。

01-09区为特殊符号。

16-55区为一级汉字,按拼音排序。

56-87区为二级汉字,按部首/笔画排序。

10-15区及88-94区则未有编码。

举例来说,“啊”字是GB2312之中的第一个汉字,它的区位码就是1601。字节结构在使用GB2312的程序中,通常采用EUC储存方法,以便兼容于ASCII。每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”,第二个字节称为“低位字节”。 “高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。例如“啊”字在大多数程序中,会以0xB0A1储存。(与区位码对比:0xB0=0xA0+16,0xA1=0xA0+1)。

所以GB2312编码中汉字区码的十进制是从176到247,位码是从161到255.之所以存储了6763小于82*94=6768,是因为在区码为215,位码为250-254之间共五个编码没有汉字编码,所以6768-5=6763个。

GB2312编码可以通俗理解为国内通用的语言。

推荐charset使用编码

UTF-8可以通俗理解简体繁体可用此编码如台湾和内地使用此编码。

因编码导致网页兼容错误问题

如果编码混排将使网页乱码也叫不兼容,特别是在CSS注释中使用了编码混排将导致css hack。

希望以后在制作网页的时候千万不要忘记对网页编码的声明。

以上就是HTML语言编码的知识,更多精彩请关注php中文网其它相关文章!

相关内容:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Google 的 Go 语言编码风格主要规定了 Go 程序应该如何编写和格式化。这包括命名规则、代码布局、注释风格以及如何组织代码等方面。 Google 的 Go 语言编码风格的目的是使代码易于阅读和维护。通过规范的编码风格,可以使团队中的开发人员之间的代码风格保持一致,从而提高代码的可读性和可维护性。 Google 的 Go 语言编码风格的具体规则可以在以下地址查看: https://golang.org/doc/effective_go.html#formatting https://golang.org/doc/style 希望这对你有帮助。 ### 回答2: Google的Go语言编码风格中文版是一种规范化的编码指南,用于指导开发者在编写Go代码时遵循一致的风格和最佳实践。此指南旨在提高代码的可读性、可维护性和可重用性,使不同开发者的代码在语法结构和格式上保持一致。 Go语言编码风格中文版包含了对代码布局、命名规范、注释规则和错误处理等方面的要求。例如,代码布局要求使用四个空格缩进代码,每行代码不应超过80个字符,并遵循大括号换行的规则。命名规范要求使用驼峰命名法并避免使用简写或缩略词,同时使用具有明确含义的变量和函数名。注释规则要求在代码中添加清晰的注释,解释代码的功能、参数、返回值等信息。错误处理要求在代码中显式处理错误,并避免使用不明确的错误处理方式。 此外,Go语言编码风格中文版还包含了一些建议和最佳实践,例如推荐使用Go提供的标准库和语言特性,避免滥用指针和全局变量,以及使用测试驱动开发等等。 遵循Google的Go语言编码风格中文版可以帮助开发者写出一致、清晰和高质量的Go代码。通过统一的编码风格,团队成员可以更容易地理解和维护彼此的代码,减少代码出错的概率,并提高整体代码的可读性和可扩展性。 ### 回答3: Go语言是一种由Google开发的开源编程语言,具有简洁、高效、安全等特点。为了保持代码的一致性和可读性,Google提供了Go语言编码风格指南,包括中文版。 首先,指南强调使用英文命名变量、函数和类型,并且遵循驼峰拼写法。这样做可以增加代码的可读性,方便其他开发者理解和维护代码。 其次,指南强调使用标准库提供的包和函数,而不是自己编写重复的代码。Go语言拥有丰富的标准库,通过使用标准库可以提高开发效率,减少代码的复杂性。 另外,指南还推荐使用清晰的注释,解释代码的功能和意图。良好的注释可以帮助其他开发者更好地理解代码,并且在以后的维护过程中提供指导。 指南还提供了一些建议和规则,例如使用错误处理机制代替错误码、避免过度使用全局变量、尽量避免循环依赖等。这些规则有助于提高代码的质量,降低bug的产生概率。 总的来说,Google的Go语言编码风格指南中文版旨在帮助开发者编写清晰、一致、可读性强的代码,并且遵循Go语言的最佳实践。遵循这些指南可以提高代码的可靠性、可维护性和可扩展性,对于Go语言的开发者来说是非常有价值的参考文档。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值