编码集
概述:
数据类型的时候有字符和字符串类型 两种类型代表了语言的文字,计算机不认识 文字,只认 识0和1,人为了计算机可以认识文字,给每一个文字字符设计了一个 十进制的数字编码。把编 码转换为二进制的数字给计算机进行识别存储。
编码:把文字转换为对应的数字存储到计算机中的过程叫编码【文字变数字】。
解码:把计算机中存储的数字取出来变为编码时对应的文字叫解码【数字变文 】。
编码集:就是一个语言对应的数字编码的关系的集合表 。
ASCII表
特殊字符的编码需要记忆:
- ASCII码表:最早期的纯英文的对应数字编码的基本表。
字符0 :48
字符A :65 ; Z:90
字符a :97 ;z: 122 - 汉字对应的编码集:GBK【包含繁简体】 gbk2312【简体】 big5【繁体】
GBK:在ASCII码表的基础上扩展中文编码出现的编码表。
GBK的编码中: 一个字母占1个字节,一个中文占2个字节 。 - 编程的时候需要使用编码集,不同的国家有不一样的编码集,国际相关组 织为了编程的统一【国际化】尽量把全世界的语言进行统一的编码设定, 产生很多版本编码集,这些编码集统称Unicode编码集【万国码】;其中UTF-8深受全世界开发人员的喜爱。
UTF-8的编码中: 一个字母占1个字节,一个中文占3个字节 。
注意: 编码的时候可以选择合适编码集,解码的时候就需要使用对应的编码集来 解码才匹配。 如果解码和编码使用的编码集不一样,会出现乱码现象。