web前端零基础入门2

本文介绍了计算机中不同进制的基本概念,包括十进制、二进制、八进制和十六进制,强调了所有数据底层以二进制形式存储。同时,讲解了字符编码、解码和字符集的重要性,如ASCII、ISO88591、GB2312、GBK和UTF-8。讨论了乱码产生的原因,即编码和解码时字符集不一致,并给出了在HTML中设置字符集避免乱码的方法。
摘要由CSDN通过智能技术生成

关于进制

进制

十进制

特点:①满十进一
②计数:0 1 2 3 4 5 6 7 …12 13 …19 20
③单位数字 十个(0—9)

二进制

特点:①满二进一
②计数:0 1 10 11 100 110 111
③单位数字:2个(0—1)

八进制

特点:①满八进一
②计数:0 1 2 3 4 5 6 7 10 11 … 17 20
③单位数字:8个(0—7)

十六进制

(一般显示一个二进制数字时,都会转换为十六进制)
特点:①满十六进一
②计数:0 1 2 3 4 5 6 7 8 9 a b c d e f 10 11 12 …1a 1b 1c 1d 1e 1f 20…
③单位数字:16个(0—f)

注意

-所有数据在计算机底层都会以二进制的形式保存
-可以将内存想象为一个有多少个小格子组成的容器,每一个小个子都可以存储一个1或者一个0.
这个小格子在内存中被称为1位(bit)

字节换算

8bit=1byte(字节)
1024byte = 1 kb(千字节)
1024kb = 1 mb(兆字节)
1024mb = 1 gb(吉字节)
1024gb = 1 tb(特字节)
1024tp = 1pb

字符编码

在这里插入图片描述

  • 我们所有的数据在计算机中存储时都是以二进制的形式存储的,文字也不例外。
  • 所有一般的文字存储时,都需要转换为二进制编码。
  • 当我们读取这段文字时,计算机会将编码转换成字符,供我们阅读。

编码

将字符转换为二进制的过程叫做编码

解码

将二进制转换成字符的过程叫做解码

字符集

编码和解码采用的规则成为字符集(charset)

乱码问题

如果编码和解码采用的字符集不同就会出现乱码问题

常见的字符集

ASCII

ASCII是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其扩展版本延伸美国标准信息交换码则可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。

ISO88591

编码是单字节编码,向下兼容ASCII,其编码范围是0x000xFF,0x000x7F之间完全和ASCII一致,0x800x9F之间是控制字符,0xA00xFF之间是文字符号

GB2312

GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。

GBK

GBK即汉字内码扩展规范,K为扩展的汉语拼音中“扩”字的声母。英文全称Chinese Internal Code Specification。GBK编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。

UTF-8

UTF-8是一种针对Unicode的可变长度字符编码,由Ken Thompson于1992年创建。它可以用来表示Unicode标准中的任何字符,且其编码中的第一个字节仍与ASCII兼容,这使得原来处理ASCII字符的软件无须或只须做少部份修改,即可继续使用。

HTML中怎样设置字符集,避免乱码

在这里插入图片描述
使用charset标签,但是注意了
在这里插入图片描述
这里的UTF-8要和下图中你的软件里的字符集一样
在这里插入图片描述
如果我们的字符集不一致,那么会出现以下情况
在这里插入图片描述
在这里插入图片描述
就会出现这种看都看不懂的乱码!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值