前面和大家分享了python的环境安装,今天简单介绍下python的编码
Python标识符:
和其他语言基本一致,标识符是包括变量名在内的,
由我们自己定义,或者程序内置的具有一定意义的逻辑符号。
标识符是由字母,下划线,数字构成。其中数字不能放首位,
举个栗子:
有效标识符 __alala a1b2_23
无效的 2thing,this is s, my-hahaha
Python编码:
编码简述:
计算机在最初的设计时采用8个比特(bit)作为一个字节(byte),每一个比特就是一个二进制的0或者1。所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节
ASCII编码是最早的编码
编码种类和区别:
GB2312 中文汉字 2字节
简称GBK(国标码)一个中文对应2个字节
Unicode 通用编码 3字节
UTF-8 可变长编码 1-6字节
一般的编码是按照ASCII规则进行编码,中文一个字对应3个字节
主要使用GBK和UTF-8这两种编码
小练习:分别用utf-8以及GBK编码自己的名字,并观察所占的位数
注:encode是将字符串转换成编码
那么怎么将编码转换回字符串呢?
注:decode是将编码转换为字符串
我也是一个python初学者,可能很多人和我一样,我会持续和大家分享我在科多大数据学习python的技术点、项目和经验,希望对大家有帮助