Python基础学习笔记（二）——编码_命名

dandellion_

已于 2024-05-28 15:34:46 修改

阅读量931

点赞数 19

分类专栏： python语法文章标签：学习笔记 python

于 2024-05-14 22:36:50 首次发布

本文链接：https://blog.csdn.net/dandellion_/article/details/138864277

版权

python语法专栏收录该内容

10 篇文章 1 订阅

订阅专栏

一、编码

1. 字节

字节（Byte）是计算机中存储数据的基本单位，通常由8个位（bit）组成。一个字节存储8位无符号数，储存的数值范围为0-255。在大多数计算机系统中，一个字节可以存储一个字符，或者一个小的整数。

2. ASCII

字符代码表（American Standard Code for Information Interchange），又称二字码表，是一种计算机系统中最常用的字符编码标准之一。

它使用7位二进制数字定义了128个字符，包括数字、字母、标点符号和控制字符，也包含了常见字符的对应十进制和十六进制表示。其中，0~31为非打印控制字符（人脸、方心梅桃、上下左右、音符、雌雄），32~127为打印字符（标点、字母大小写、数字、运算符），形状与含义无关，剩余128预留给国外使用。

ASCII第一次以规范标准的类型发表是在1967年，最后一次更新则是在1986年。

3. 编码格式的后续发展

GB2312（Guo Biao 2312）：中国国家标准总局于1980年代初制定的一种简体中文字符集标准，包含6763个汉字和682个非汉字字符。
GBK（Guo Biao Ku）：在GB2312-80的基础上进行扩展的中文编码字符集，增加了更多的汉字和符号。GBK编码共有两个版本，分别是GBK1和GBK2，其中GBK1包含了21003个汉字和符号，GBK2包含了662个汉字和符号。
GB18030（Guo Biao 18030）：信息技术中文编码字符集，中国国家标准总局于2000年发布的中文编码标准，可表示简/繁体中文、维吾尔文、藏文，共17484个字符，每个字符可由1、2、4个字节组成。
Unicode：也叫万国码、单一码，由统一码联盟开发，是计算机科学领域里的业界字符编码标准，它为世界上几乎所有的文字和符号分配了唯一的数字代码，所有字符用2个字节表示，即16进制。
UTF-8（8-bit Unicode Transformation Format）：一种可以表示 Unicode 所有字符的可变长度的编码方式。

它使用 1 到 4 个字节来表示一个字符，其中 ASCII 字符（英文）使用一个字节表示，中文用3个字节表示，而其他字符使用多个字节表示。这种编码方式使得 UTF-8 在存储和传输 Unicode 字符时更加高效。

二、对象命名

1. 标识符

在Pyhon编程中，标识符指的是用来命名变量、函数、类等对象的名称。它通常由字母、数字和下划线组成，但不能以数字开头，不能使用保留字，并且严格区分大小写。

现在的Python编译器在某些情况下支持汉字命名和数字开头。

2. 保留字

给任何对象命名都不可使用的单词。以下代码可查看保留字列表：

import keyword
print(keyword.kwlist)

['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 
'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 
'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 
'raise', 'return', 'try', 'while', 'with', 'yield']