关于文字编码方面的知识点的一些整理

最新推荐文章于 2021-06-30 10:30:32 发布

kidlalala

最新推荐文章于 2021-06-30 10:30:32 发布

阅读量396

点赞数

文章标签：编码

本文链接：https://blog.csdn.net/kidlalala/article/details/51888434

版权

先来说说最近学习时候接触的一些编码方式：

1.首先当然是最经典的ascii码

2.big5 繁体中文

3.gb2312 简体中文

4.gbk 中文编码扩展包含简体中文和繁体中文

4.utf-8 世界通用的编码

首先遇到的问题是曾经在写HTML+CSS的时候head便签里总会有这么一句:

有一天去掉了之后发现在网页上出现乱码后来查阅资料才发现写网页的时候用的编码方式是gb2312 而网页读取时是用的utf-8

出现乱码的原因是这两种不同的编码方式对应的每一个字符对应的字节数都不同所以读取时按照各自的读取字节数读取自然造成乱码

然后上网查阅资料发现在本机上操作时都采用Unicode编码相关资料如下：

点击打开链接

而Unicode与utf-8有所区别知乎上有一篇文解释的个人认为很清楚这里给出链接

而在计算机中本机在用文字编辑器如记事本中使用的Unicode编码

而当这些内容需要上传到网络或者写入到磁盘中去时计算机将以utf-8的编码方式将之写入

这里写入一点个人想法欢迎大神指教

个人的想法是应该是以标准化方式写入而为了可移植性和文件传阅所以上文提到的情况下将之装换为utf-8

总之之前一直迷惑的问题在这里终于算透彻理解了字符编码的一些规则和方式在这里做一下简略的笔记

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kidlalala

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

编码知识整理

少年阿涛

09-08

413

软考中级-软件设计师 知识点整理（一篇就过了建议收藏）

热门推荐

Y的博客

09-23

11万+

软考中级-软件设计师上午题知识点总结

参与评论您还未登录，请先登录后发表或查看评论

编码知识点整理

weixin_30552635的博客

09-20

267

目录编码知识点整理编码测试参考资料编码知识点整理编码测试 //eclipse文件编码为utf-8 public class EncodeTest { public static void main(String[] args) throws Exc...

字符集编码相关知识点

太陽の金貨的博客

12-21

481

1.汉字编码 GB2312(简体) BIG5(繁体) GBK(国标扩展，支持繁体) Unicode(分成17个panel，0x0000~0x10_0000，一般只用到BMP基础面)2.Unicode表示方法 UTF-8 使用最广泛的Unicode变长表示方法，在第一个字节中包含字节长度信息 UTF-16BE 也是一种变长表示方法，使用2个或者4个字节表示一个字符 UT

字符编码基础知识

diny77的博客

06-30

184

**字节：**计算机内部用二进制字符串表示信息，每一个二进制位bit有两种状态，因此一个字节byte=8个二进制位，可以组合出2^8=256中状态。 **ASCII码：**美国制定了一套规范英文字符和二进制位对应关系的规定——ASCII码，特点是第一位规定为0，只占用一个字节中的后7位，即一共规定了2^7128个字符的编码。 **非ASCII码：**其他国家规定的，用来表达除英文字符外的国家语言符号，由于没有统一规范，所以不同国家的编码方式，128-255这一段表达的符号是不一样的。 Unicode：——.

字符编码知识整理

phwater的专栏

03-24

591

前端之HTML知识点整理汇总(推荐)

09-28

它由一系列的标签组成，用于定义页面的结构、内容和外观。... ...标签是一对尖括号内的单词，如，它们定义了网页的元素。...标签分为开始标签和结束标签，开始...掌握这些知识点，对于制作出结构良好、内容丰富的网页至关重要。

(完整版)微机原理与接口技术知识点总结整理.doc

11-24

《微机原理与接口技术》是一门涵盖计算机基础和硬件接口技术的重要课程。这门课程主要涉及以下几个核心知识点： ...在实际应用中，这些知识点还会延伸到中断系统、I/O接口、存储器组织、汇编语言编程等方面。

数电知识点整理.docx

03-25

【数字电子知识点整理】在数字电子学中，我们主要研究的是数字信号的处理和逻辑运算。数字信号与模拟信号有着显著的区别。模拟信号是幅度和时间连续变化的，如正弦波，而数字信号则在时间和幅度上取值都是离散的，...

JAVA期末复习知识点整理

最新发布

06-16

JAVA期末复习知识点整理本资源是对JAVA语言的总结和整理，涵盖了JAVA语言的基础知识点，包括JAVA的工作原理、Unicode编码、Java应用程序的结构、package语句、import语句、类的定义、main方法、System.out.println...

汉字编码知识简述

thewebcode

12-11

1103

汉字的计算机编码已经产生并应用了大约20几年，我接触计算机编程大概10年了，汉字编码深入应用并不多，却不可避免。本文目的旨在介绍汉字编码的发展历程，主流汉字编码的基本原理、应用等。为了方便后面的理解，先列几个名词解释：ASCII：基本学过计算机的人都知道，不详细解释含义了，他是我们现在应用计算机的主流编码字符集，需要注意的是他的二进制最高位为1时是扩展ASCII码，常用的字母、数字、符号、控制字符...

汉字编码基础知识（一）

冷秋魂的专栏

12-26

2146

4.1)基础知识4.1.1) GB2312范围：0xA1A1--0xFEFE汉字范围：0xB0A1--0xF7FE编码方式：GB2312规定"对任意一个图形字符都采用两个字节表示，每个字节均采用七位编码表示"，习惯上称第一个字节为"高字节"，第二个字节为"低字节"。字符集： GB2312(1980年)一共收录了7445个字符，包括6763个汉字和

汉字信息的编码知识

ruowu的专栏

08-12

1471

1、区位码：GB2312-80字符集，组成一个94*94的矩阵。每一行称为一个“区”，每一列称为一个“位”。一个汉字的区号和位号合在一起构成“区位码”，区位码的编码范围是：0101～9494。2、国标码：国标码=（区位码的十六进制表示）+2020H，国标码的取值范围：2121H～7E7EH。3、机内码：中文或西文信息在计算机系统中的代码表示称为机内码。ASCII码是一种西文机内码，用一个字节表示...

基础知识总结：字符编码

weixin_40773253的博客

10-31

300

因为数据是二进制表示的，现在存在各种各样的编码，因为计算机识别的编码与数据本身的编码不一致，就会造成乱码。 ASCII 美国规定的128个字符表示的二进制表示方法，这种方法称为ASCII码，计算机存储的最小单位是字节（8位），ASCII码的后7位表示字符本身，最高位设置为0，后7位0~127表示128个字符，ASCII码对美国够用了，但是对其他国家其他字符远远不够。 ISO 8859

编码知识小结

meteor1113的专栏

07-15

3611

编码知识小结最早的编码是ascii，它只在1-127，用一个字节就可以表示出来。并且这个字节的第一个位是0。后来，很多国家的语言发现ascii表示的字符太少，比如中文是不可能表示了来的，所以每个国家都发展了自己的扩展编码，如中国的gb2312,台湾的big5,日本的shift-jis等。各个国家的扩展编码有一点是相同的，就是都采用了最大长度为2的变长编码，这主要是为了和asc

汉字编码相关知识收集

小猪的Blog

09-21

4012

字符编码：字符编码就是以二进制的数字来对应字符集的字符，目前用得最普遍的字符集是ANSI，对应ANSI字符集的二进制编码就称为ANSI码，DOS和Windows系统都使用了ANSI码，但在系统中使用的字符编码要经过二进制转换，称为系统内码。　　汉字内码：ANSI码是单一字节（8位二进制数）的编码集，最多只能表示256个字符，不能表示众多的汉字字符，各个国家和地区在ANSI码的基础上又设计了各种不

计算机基础知识文字,计算机基础知识：汉字编码

weixin_31491059的博客

06-28

996

【导语】在事业单位考试中，计算机专业知识的复习向来是考生复习备考阶段的一大重点，其中中公事业单位考试网为计算机基础知识的复习为考生提供知识点梳理，帮助考生备考!一、《信息交换用汉字编码字符集·基本集》GB2312-80中规定了信息交换用的6763个汉字和682个非汉字图形符号的代码。在此标准中，每个汉字(图形符号)采用2个字节表示。此标准的汉字编码表有94行、94列。其行号称为区号，列号称为位号。...

字符编码认识

jingyin's blog

05-04

268

常用的几种编码方式（一） ASCII码（美国标准字化符集）由7个二进制位编码表示128个字符（二） Unicode 跨平台、跨语言统一且唯一的二进制编码每个字符两个字节长 65536个字符的编码空间（三）UTF-8 可变长度的Unicode

汉字编码的常识 (转)

sunxboy的专栏

04-11

295

在基于 Java 语言的编程中，我们经常碰到汉字的处理及显示的问题。一大堆看不懂的乱码肯定不是我们愿意看到的显示效果，怎样才能够让那些汉字正确显示呢？Java 语言默认的编码方式是UNICODE ，而我们中国人通常使用的文件和数据库都是基于 GB2312 或者 BIG5 等方式编码的，怎样才能够恰当地选择汉字编码方式并正确地处理汉字的编码呢？本文将从汉字编码的常识入...

计算机一级考试重点：基础知识点与解析

8. 汉字编码：汉字的机内码是通过国际码加上8080H得到的。若汉字机内码为B0A1H，则国际码为B0A1H - 8080H = 3021H。 9. 操作系统功能：操作系统是计算机系统的核心，它主要负责管理硬件和软件资源，包括内存分配、...