1.字符串的表示形式
1.1 “字符串”
1.2 ‘字符串’
1.3 ‘’‘字符串’’’
1.4 “”“字符串”""
2.转义字符
\n 换行
\t 制表符
\’ 单引号
\" 双引号
s3 = '''he\\\ll\'mmm\'pp\t\t\"s
wor/l\\d'''
print(s3) # he\\ll'mmm'pp "s
# wor/l\d
3.类型转换
int()
str()
float()
a = 23
print(a + "45.8") #unsupported operand type(s) for +: 'int' and 'str'
解决办法
a = 23
print(str(a) + "45.8") # 2345.8
3.1 字符串可相乘
s1 = 'hello'
print(s1 * 10) # hellohellohellohellohellohellohellohellohellohello
3.2 字符串的方法
编码与解码
s1 = "编程"
s2 = s1.encode('utf-8')
s3 = s2.decode('utf-8')
print(s2) # b'\xe7\xbc\x96\xe7\xa8\x8b'
print(s3) # 编程
字符编码
10进制 2进制 8进制 16进制
0 0000 000 0
1 0001 001 1
2 0010 010 2
…
7 0111 111 7
…
10 1010 A
11 1011 B
…
15 1111 F
1.计算机只能处理数字,如处理文本,需将其转换为数字
字节bytes k M G
bit比特
1字节=8比特(位) 最大表示的整数是255
0000 0000
两个字节表示的最大的整数:65535
2、0-9 a-z A-Z ./,?
ASCII码 128个字符,一个字节
0–48
A–65
a–97
空格–32
esc–27
3、中国 GBK,GB2312, 台湾 big5
各国标准不一致,会出现乱码
4、unicode 将所有语言都统一到一套编码中
通常用两个字节表示一个字符,但非常生僻的字符会用到4个字节
5、ASCII与UNICODE区别
1字节 2字节(4字节)
ASCII A 65 01000001
UNICODE A 65 00000000 01000001
utf-8 可变长编码:将一个unicode字符根据不同的大小编成1-6个字节
通常:英文字母1个字节,
中文 3个字节
生僻字 4-6个字节