目录
一、编码
1. 字节
字节(Byte)是计算机中存储数据的基本单位,通常由8个位(bit)组成。一个字节存储8位无符号数,储存的数值范围为0-255。在大多数计算机系统中,一个字节可以存储一个字符,或者一个小的整数。
2. ASCII
字符代码表(American Standard Code for Information Interchange),又称二字码表,是一种计算机系统中最常用的字符编码标准之一。
它使用7位二进制数字定义了128个字符,包括数字、字母、标点符号和控制字符,也包含了常见字符的对应十进制和十六进制表示。其中,0~31为非打印控制字符(人脸、方心梅桃、上下左右、音符、雌雄),32~127为打印字符(标点、字母大小写、数字、运算符),形状与含义无关,剩余128预留给国外使用。
ASCII第一次以规范标准的类型发表是在1967年,最后一次更新则是在1986年。
3. 编码格式的后续发展
- GB2312(Guo Biao 2312):中国国家标准总局于1980年代初制定的一种简体中文字符集标准,包含6763个汉字和682个非汉字字符。
-
GBK(Guo Biao Ku):在GB2312-80的基础上进行扩展的中文编码字符集,增加了更多的汉字和符号。GBK编码共有两个版本,分别是GBK1和GBK2,其中GBK1包含了21003个汉字和符号,GBK2包含了662个汉字和符号。
-
GB18030(Guo Biao 18030):信息技术中文编码字符集,中国国家标准总局于2000年发布的中文编码标准,可表示简/繁体中文、维吾尔文、藏文,共17484个字符,每个字符可由1、2、4个字节组成。
-
Unicode:也叫万国码、单一码,由统一码联盟开发,是计算机科学领域里的业界字符编码标准,它为世界上几乎所有的文字和符号分配了唯一的数字代码,所有字符用2个字节表示,即16进制。
-
UTF-8(8-bit Unicode Transformation Format):一种可以表示 Unicode 所有字符的可变长度的编码方式。
它使用 1 到 4 个字节来表示一个字符,其中 ASCII 字符(英文)使用一个字节表示,中文用3个字节表示,而其他字符使用多个字节表示。这种编码方式使得 UTF-8 在存储和传输 Unicode 字符时更加高效。
二、对象命名
1. 标识符
在Pyhon编程中,标识符指的是用来命名变量、函数、类等对象的名称。它通常由字母、数字和下划线组成,但不能以数字开头,不能使用保留字,并且严格区分大小写。
现在的Python编译器在某些情况下支持汉字命名和数字开头。
2. 保留字
给任何对象命名都不可使用的单词。以下代码可查看保留字列表:
import keyword
print(keyword.kwlist)
['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class',
'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from',
'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass',
'raise', 'return', 'try', 'while', 'with', 'yield']
3. 驼峰命名法
驼峰命名法(Camel Case)不同单词之间没有分隔符,采用大小写混合的方式区分不同单词。 目前业界最广泛的命名规范。
3.1 小驼峰
- 第一个单词首字母小写,其他单词首字母大写,如 getMyName
- 一般用于变量名和方法名
3.2 大驼峰
- 全部单词首字母大写,如 CheckName
- 一般用于接口名和类名