大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳,不仅形成深入且独到的理解,而且能够帮助新手快速入门。
本文主要介绍了python中的解码与编码,希望能对学习Python的同学们有所帮助。
1. 基本概念
- 比特(bit):计算机中最小的数据单位,是单个的二进制数值0或1
- 字节(byte):计算机村塾数据的单元,1个字节由8个比特组成,如b’\xc3\xc0\xc0\xf6\xc8\xcb\xc9\xfa’(b开头表示字节,一个斜杠就是一个字节)
- 字符:人类能够识别的符号,如“中国”、“cat”等。一个常用汉字用GBK编码后占用2个字节,用utf-8编码后占3个字节。
- 编码:将人类可以识别的字符转换为及其可识别的字节
- 解码:编码的反向过程。
- 简介:Unicode编码是人类可识别的字符格式;ASCII、utf-8&#