如果字符内既包含'又包含"可以用转义字符 \ 来标识
\n 表示换行,\t 表示制表符, 用 \ \ 表示字符 \ ,可以用 r" 表示 “内部的字符串默认不转义” ,当字符串内部存在很多换行时,用'''...'''的格式来换行跟 \n 的用法一样,方便阅读。
用 True、False表示布尔值(逻辑值,注意大小写)
条件选择运算(and or not )布尔值经常用在判断中(注意缩进....文本体现没有缩进)
for example:
if age >= 18:
print('adult')
else
print('teenager')
注意数据类型转换:
int() ——转整型
float() ——转浮点型
str() ——转字符型
等号 = 是赋值语句,可以吧任意的数据类型赋值给变量,同一个变量可以反复赋值,可以是不同类型的变量。
编码 ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符。
x='ABC'.encode('ascii')
b'ABC'
x='中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'
内容编译,ASCII,Unicode(utf-8)
x=b'ABC'.decode('ascii')
'ABC'
x=b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
'中文'
如果bytes中包含无法解码的字节,decode()会报错。
如果bytes中只有一小部分无效的字节,可以传入errors='ignore'忽略错误的字节:
x=b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')
'中'
用len()函数计算str包含多少个字符,如果换成bytes,len()函数就计算字节数。可见(一个中文字符经过UTF-8编码后占用3个字节,而一个英文字符只占用一个字节)
为避免乱码问题,在str和bytes互相转换时,使用UTF-8编码对str和bytes进行转换。
由于Python源代码也是一个文本文件,所以,当你的源代码中包含中文的时候,在保存源代码时,就需要务必指定保存为UTF-8编码。当Python解释器读取源代码时,为了让它按UTF-8编码读取,我们通常在文件开头写上
“” #!/usr/bin/env python3
“” # -- coding: utf-8 -- (前面的“忽略”)
第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;
第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码。
转载于:https://blog.51cto.com/11329186/2118734