语法
- print('The quick brown fox', 'jumps over', 'the lazy dog') print输出逗号隔开,显示则自动加上空格
- name = input('please enter your name: ') 是IO 字符串输入
- 字符串 r' ' 表示内部默认不转义
- None 为python 特殊空值, 常量要全大写, 除法 / 为浮点精确除法, // 为向下取整除法
- 编码
- 最早编码ASCII 标准为1字节编码,只支持英文数字等字符;各国语言有不同编码,多语言混合的文本就比较混乱
- Unicode统一了各国语言标准,常用字符两字节,不常用为4字节,可以支持中文
- ‘A’ ASCII对应编码1字节,Unicode需在高1byte补0,有空间浪费;从而Unicode演进出可变长编码的UTF-8编码
- UTF-8 英文字母1字节,汉字3字节,生僻字符4-6字节; 相当于ASCII的扩展
- 一般在硬盘文件或网络传输中用UTF-8编码,而内存或显示中用Unicode
- Python 3 中字符串以Unicode编码,通过ord() 函数和chr函数分别获取对应编码数字和字符,如‘中文’ ->'\u4e2d\u6587'
- python 字符串(Unicode) 转字节流需通过str.encode("utf-8") 转成bytes b'\xe4\xb8\xad\xe6\x96\x87' , 通过decode 解码成Unicode